JP4773680B2

JP4773680B2 - 情報処理装置および方法、プログラム記録媒体、並びにプログラム

Info

Publication number: JP4773680B2
Application number: JP2003289138A
Authority: JP
Inventors: 真人伊藤; 淳谷
Original assignee: Sony Corp; RIKEN Institute of Physical and Chemical Research
Current assignee: Sony Corp; RIKEN Institute of Physical and Chemical Research
Priority date: 2003-08-07
Filing date: 2003-08-07
Publication date: 2011-09-14
Anticipated expiration: 2023-08-07
Also published as: US7373333B2; US20050086183A1; CN1581143A; EP1505534A3; EP1505534A2; JP2005056340A; CN100580654C

Description

本発明は、情報処理装置および方法、プログラム記録媒体、並びにプログラムに関し、特に、学習効率を向上させ、かつ、規模が容易に拡張できるようにした、情報処理装置および方法、プログラム記録媒体、並びにプログラムに関する。

従来より、人間や動物の脳に関する１つのモデルとして、ニューラルネットワークが研究されている。ニューラルネットワークにおいては、所定の運動パターンを予め学習しておくことにより、入力されたデータが学習した運動パターンに対応するか否かを識別することができる。

運動パターンを認識するモデルとして、ローカル表現スキームによる運動パターン学習モデルと、分散表現スキームによる運動パターン学習モデルが知られている。

ローカル表現スキームによる運動パターン学習モデルにおいては、図１に示されるように、独立したローカルモジュール１−１乃至１−３がそれぞれの対応するゲート２−１乃至２−３を介して結合される。ローカルモジュール１−１乃至１−３は、それぞれ独立した運動パターンを学習する。

ローカル表現スキームによる運動パターン学習モデルにおいては、ゲート２−１乃至２−３を制御することで、全体の出力が決定される。

このローカル表現スキームによる運動パターン学習モデルについては、特許文献１に開示されている。

一方、分散表現スキームによる運動パターン学習モデルにおいては、図２に示されるように、モジュール２１が複数の運動パターンを学習する。

特開平１１−１２６１９８号公報

しかしながら、このローカル表現スキームによる運動パターン学習モデルにおいては、パターン間の関係性を考慮しないため、複数のパターンを汎化して学習することが困難である課題があった。

また、分散表現スキームによる運動パターン学習モデルにおいては、少数のパラメータを持つ１つのモジュールに複数の運動パターンを学習させるため、学習の効率が悪く、規模拡張性が困難であるという課題があった。

本発明はこのような状況に鑑みてなされたものであり、学習効率を向上させ、かつ規模が容易に拡張できるようにするものである。

本発明の情報処理装置は、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成され、第１の運動パターン学習モデルと第２の運動パターン学習モデルは、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する。

本発明の情報処理方法は、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置の情報処理方法であって、第１の運動パターン学習モデルが、複数の第１の時系列パターンを学習する第１の学習ステップと、第２の運動パターン学習モデルが、複数の第２の時系列パターンを学習する第２の学習ステップと、第３の運動パターン学習モデルが、時系列パターンを認識または生成する認識・生成ステップとを含み、第１の学習ステップおよび第２の学習ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する。

本発明の記録媒体のプログラムは、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、複数の第１の時系列パターンの学習を制御する第１の学習制御ステップと、複数の第２の時系列パターンの学習を制御する第２の学習制御ステップと、時系列パターンの認識または生成を制御する認識・生成制御ステップとを含む処理をコンピュータに実行させ、第１の学習制御ステップおよび第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する。

本発明のプログラムは、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、複数の第１の時系列パターンの学習を制御する第１の学習制御ステップと、複数の第２の時系列パターンの学習を制御する第２の学習制御ステップと、時系列パターンの認識または生成を制御する認識・生成制御ステップとを含む処理をコンピュータに実行させ、第１の学習制御ステップおよび第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する。

本発明においては、第１と第２の運動パターン学習モデルが、分散表現スキームによるモデルとされ、ローカル表現スキームによる第３の運動パターン学習モデルが、第１の運動パターン学習モデルと第２の運動パターン学習モデルにより構成される。また、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成され、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差が演算されるとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数が、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算され、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値が、学習パラメータとされるように、学習パラメータが、修正される。

本発明によれば、運動パターンを学習することができる。特に、学習効率を向上させ、かつ規模を容易に拡張することが可能となる。

以下に本発明を実施するための最良の形態を説明するが、明細書中に記載の発明と、実施の形態との対応関係を例示すると、次のようになる。明細書には記載されているが、発明に対応するものとして、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その発明に対応するものではないことを意味するものではない。逆に、実施の形態が発明に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その発明以外の発明には対応しないものであることを意味するものでもない。

さらに、この記載は、明細書に記載されている実施の形態に対応するすべての発明が、記載されていることを意味するものではない。換言すれば、この記載は、明細書に記載されている他の発明の存在、すなわち、将来、分割出願されたり、補正により出現、追加される発明の存在を否定するものではない。

本発明は、時系列パターンを処理する情報処理装置（例えば、図３の処理装置４１）を提供する。この情報処理装置は、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデル（例えば、図３のローカルモジュール４３−１）および分散表現スキームによる第２の運動パターン学習モデル（例えば、図３のローカルモジュール４３−２）と、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデル（例えば、図３の統合モジュール４２）とを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワーク（例えば、図５のRNN６１−１，６１−２）により構成される。

また、この情報処理装置の第１の運動パターン学習モデルと第２の運動パターン学習モデルは、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差（例えば、式（５）の学習誤差ei）を演算するとともに（例えば、図２５のステップＳ１１４の処理）、それぞれの運動パターン学習モデルについての学習パラメータ修正量（例えば、式（７）の学習パラメータ修正量Δw’i）の重み付け係数（例えば、式（６）の重み付け係数gi）を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し（例えば、図２５のステップＳ１１５の処理）、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する（例えば、図２５のステップＳ１１７の処理）ことができる。

また、本発明は、時系列パターンを処理する情報処理装置（例えば、図３の処理装置４１）の情報処理方法を提供する。この方法は、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置の情報処理方法であって、第１の運動パターン学習モデル（例えば、図３のローカルモジュール４３−１）が、複数の第１の時系列パターンを学習する第１の学習ステップ（例えば、図３のローカルモジュール４３−１を学習させる場合の図７のステップS13）と、第２の運動パターン学習モデル（例えば、図３のローカルモジュール４３−２）が、複数の第２の時系列パターンを学習する第２の学習ステップ（例えば、図３のローカルモジュール４３−２を学習させる場合の図７のステップS13）と、第３の運動パターン学習モデルが、時系列パターンを認識または生成する認識・生成ステップ（例えば、図４のステップS3）とを含み、第１の学習ステップおよび第２の学習ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差（例えば、式（５）の学習誤差ei）を演算するとともに（例えば、図２５のステップＳ１１４の処理）、それぞれの運動パターン学習モデルについての学習パラメータ修正量（例えば、式（７）の学習パラメータ修正量Δw’i）の重み付け係数（例えば、式（６）の重み付け係数gi）を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し（例えば、図２５のステップＳ１１５の処理）、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する（例えば、図２５のステップＳ１１７の処理）。

また、本発明は、時系列パターンを処理するためのプログラムが記録されたプログラム記録媒体（例えば、図２６の光ディスク１７２）を提供する。このプログラムは、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、複数の第１の時系列パターンの学習を制御する第１の学習制御ステップ（例えば、図３のローカルモジュール４３−１を学習させる場合の図７のステップS13）と、複数の第２の時系列パターンの学習を制御する第２の学習制御ステップ（例えば、図３のローカルモジュール４３−２を学習させる場合の図７のステップS13）と、時系列パターンの認識または生成を制御する認識・生成制御ステップ（例えば、図４のステップS3）とを含む処理をコンピュータに実行させ、第１の学習制御ステップおよび第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差（例えば、式（５）の学習誤差ei）を演算するとともに（例えば、図２５のステップＳ１１４の処理）、それぞれの運動パターン学習モデルについての学習パラメータ修正量（例えば、式（７）の学習パラメータ修正量Δw’i）の重み付け係数（例えば、式（６）の重み付け係数gi）を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し（例えば、図２５のステップＳ１１５の処理）、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する（例えば、図２５のステップＳ１１７の処理）ようにすることができる。

また、本発明は、時系列パターンを処理するためのプログラムを提供する。このプログラムは、時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、第１の運動パターン学習モデルと第２の運動パターン学習モデルを要素とし、第１の運動パターン学習モデルと第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、第１の運動パターン学習モデルと第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、複数の第１の時系列パターンの学習を制御する第１の学習制御ステップ（例えば、図３のローカルモジュール４３−１を学習させる場合の図７のステップS13）と、複数の第２の時系列パターンの学習を制御する第２の学習制御ステップ（例えば、図３のローカルモジュール４３−２を学習させる場合の図７のステップS13）と、時系列パターンの認識または生成を制御する認識・生成制御ステップ（例えば、図４のステップS3）とを含む処理をコンピュータに実行させ、第１の学習制御ステップおよび第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差（例えば、式（５）の学習誤差ei）を演算するとともに（例えば、図２５のステップＳ１１４の処理）、それぞれの運動パターン学習モデルについての学習パラメータ修正量（例えば、式（７）の学習パラメータ修正量Δw’i）の重み付け係数（例えば、式（６）の重み付け係数gi）を、それぞれの運動パターン学習モデルの学習誤差についての指数関数と、指数関数の全ての運動パターン学習モデルについての和との比から演算し（例えば、図２５のステップＳ１１５の処理）、重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、学習パラメータと重み付け係数との積を減じた値を、学習パラメータとするように、学習パラメータを修正する（例えば、図２５のステップＳ１１７の処理）。

以下、本発明の実施の形態について説明する。

図３は、本発明を適用した処理装置の構成例を表している。この処理装置４１は、ローカル表現スキームによる運動パターン学習モデルである統合モジュール４２により構成されている。統合モジュール４２は、複数の（図３の例の場合、３個の）ローカルモジュール４３−１乃至４３−３と、それぞれに対応するゲート４４−１乃至４４−３により構成されている。ゲート４４−１乃至４４−３には、それぞれ係数W1乃至W3が設定され、その出力は、次式で表わされる。

全出力＝ΣＷｉ×modulei（pi）

なお、上記式におけるｉの値は、１，２，３であり、ローカルモジュール４３−１乃至４３−４のいずれかを表わす。また、modulei（pi）は、パラメータの値がpiである場合における各ローカルモジュール４３−１乃至４３−３の出力を表わす。

次に、図４のフローチャートを参照して、図３の処理装置４１の基本的な処理について説明する。

ステップＳ１において、統合モジュール４２をローカルモジュール４３−１乃至４３−３により生成する処理が実行される。そして、生成されたローカルモジュール４３−１乃至４３−３は、その出力が、ゲート４４−１乃至４４−３において、係数W1乃至W3と乗算された後、合成され、出力されるように構成される。

次に、ステップＳ２において学習処理が行われる。この学習処理により、各ローカルモジュール４３−１乃至４３−３に、複数の運動パターン（時系列パターン）がそれぞれ学習、記憶される。

ステップＳ２の学習処理の詳細については、図７のフローチャートを参照して後述する。

以上のようにして、運動パターンが学習された後、各ローカルモジュール４３−１乃至４３−３に、必要なパラメータを入力し、対応するパターンを出力させたり、各ローカルモジュール４３−１乃至４３−３に所定の運動パターンを入力し、それに対応する係数を出力させるといったような、この処理装置４１を利用する処理が実行される。

ステップＳ３の利用処理の詳細については、図２１および図２３を参照して後述する。

なお、ステップＳ１乃至ステップＳ３の処理は、この順番で行われるが、時間的には必ずしも連続して行われるわけではなく、ステップＳ１の処理の後、ステップＳ２の処理が実行され、また、ステップＳ２の処理の後ステップＳ３の処理が実行されるまでには、所定の時間的間隔が設けられる場合がある。

本発明の実施の形態の場合、各ローカルモジュール４３−１乃至４３−３は、図５に示されるように、それぞれ運動パターンを学習する機能を有するリカレント型ニューラルネットワーク（RNN）６１−１乃至６１−３により構成される。なお、以下においては、ローカルモジュール４３−１乃至４３−３、並びにRNN６１−１乃至６１−３を、個々に区別する必要がない場合、単にローカルモジュール４３または、RNN６１と称する。

図６は、RNN６１の構成例を表している。このRNN６１は、入力層１１１、中間層（隠れ層）１１２、および出力層１１３により構成されている。これらの入力層１１１、中間層１１２、および出力層１１３は、それぞれ任意の数のニューロンにより構成されている。

入力層１１１の一部のニューロン１１１−１には、時系列パターンに関するデータｘtが入力される。具体的には例えば、カメラ画像等を基に画像処理により得られる人間の身体運動パターン（例えば、手先位置の運動軌道等）などの時系列パターンに関するデータが入力される。

入力層１１１の一部のニューロンであるパラメトリックバイアスノード１１１−２には、パラメータＰtが入力される。パラメータＰtはベクトルであり次元は時系列パターンにより任意である。パラメトリックバイアスノードの数は、１つ以上とされる。そのノード数は、リカレント・ニューラル・ネットを構成し、かつ、モデル決定手段のパラメータであるウェイト・マトリックスの数を決定するニューロンの総数に対して、十分に小さいことが望ましい。本実施の形態では、前記ニューロンの総数が約５０個であるのに対して、パラメトリックバイアスノードの数は約１乃至２個とされる。ただし、本願発明がこの数に限定されないことは言うまでもない。

パラメトリックバイアスノードは、非線形力学系における力学構造をモジュレーションするものであり、本実施の形態においては、リカレント型ニューラルネットワークが保持する力学構造をモジュレーションする働きをするノードである。ただし、本願発明がリカレント型ニューラルネットワークに限定されるものではない。

さらに、入力層１１１の一部のニューロン１１１−３には、出力層１１３の一部のニューロン１１３−２より出力されたデータが、RNN６１の内部の状態を表すコンテキストCtとしてフィードバックされている。コンテキストCtは、リカレント型ニューラルネットワークに関する一般的用語であり、例えば、参考文献（Elman, J.L. (1990). Finding structure in time. Cognitive Science, 14, 179-211）等に説明が記載されている。

中間層１１２のニューロンは、入力されたデータに対して重み付け加算処理を行い、順次後段に出力する処理を実行する。すなわち、データｘt，Ｐt, Ctに対して所定の重み付け係数に対する演算処理（非線形関数に基づく演算処理）を行った後、出力層１１３に出力する。本実施の形態では例えば、データｘt，Ｐt，Ctの所定の重み付け和の入力に対して、シグモイド関数等の非線形出力特性を有する関数に基づく演算処理を行った後、出力層１１３に出力する。

出力層１１３を構成する一部のニューロン１１３−１は、入力データに対応するデータｘ*t+1を出力する。

また、RNN６１は、バックプロパゲーションによる学習のため、演算部１２１を有している。演算部２２は、RNN６１に対する重み付け係数の設定処理を行う。

次に、図７のフローチャートを参照して、図４のステップＳ２における学習処理の詳細について説明する。

ステップＳ１１において、各ローカルモジュール６１−1乃至６１−３の学習パラメータ（各ニューロンの重み付け係数）を演算部１２２に保存する処理が実行される。次に、ステップＳ１２において、学習対象の運動パターンを各ローカルモジュール６１−１乃至６１−３に取り込む処理が実行される。その後、ステップＳ１３においてローカルモジュール学習処理が実行される。このローカルモジュール学習処理の詳細については、図１８のフローチャートを参照して後述するが、このステップＳ１３の処理により、ローカルモジュール６１−１乃至６１−３のうちの１つ（例えば、ローカルモジュール６１−１）に１つの運動パターンが学習される。

次に、ステップＳ１４において、演算部１２２は、各ローカルモジュール６１−１乃至６１−３の学習誤差を取得し、それぞれの値を比較する。これにより、演算部１２２は、学習誤差が最小であるローカルモジュールを特定する。

ステップＳ１５において、演算部１２２は、最小の学習誤差のローカルモジュール以外のローカルモジュールに、ステップＳ１１の処理で保存しておいた学習パラメータ（重み付け係数）を戻す処理を実行する。例えば、ローカルモジュール６１−１の学習誤差が最小であった場合、ローカルモジュール６１−２，６１−３の学習パラメータ（重み付け係数）は、学習前の状態に戻される。

次に、ステップＳ１６において、演算部１２２は、全ての運動パターンの学習が完了したか否かを判定する。まだ全ての運動パターンの学習が完了していない場合、ステップＳ１１に戻り、それ以降の処理が繰り返し実行される。

ステップＳ１６において、全ての運動パターンの学習が終了したと判定された場合、学習処理は終了される。

このようにして、例えば、図８乃至図１６に示される合計９種類の運動パターンが、１つずつ、各ローカルモジュール４３−１乃至４３−３に学習される。この例においては、図１７に示されるように、ローカルモジュール４３−１により、図８乃至図１０に示される運動パターンが学習され、ローカルモジュール４３−２により、図１１乃至図１３に示される運動パターンが学習され、ローカルモジュール４３−３により、図１４乃至図１６に示される運動パターンが学習される。また、この場合、ゲート４４−１乃至４４−３には、図示せぬ装置から所定の値の係数W1乃至W3が設定される。

なお、各ローカルモジュール４３−１乃至４３−３のそれぞれには、共有可能な力学構造を有する運動パターンが学習される。この点については、図２０を参照して後述する。

次に、図１８のフローチャートを参照して、図７のステップＳ１３におけるローカルモジュール学習処理について説明する。

図１８のフローチャートに示される処理は、学習させる運動パターン毎に実行される。換言すれば、学習する運動パターンの数だけ仮想的なRNNが用意され、各仮想RNN毎に図１８の処理が実行される。

仮想的なRNN毎に図１８のフローチャートに示される処理が実行され、仮想RNN毎に運動パターンが学習された後、実際のRNN６１に対して、係数を設定する処理が実行される。ただし、以下の説明では、仮想的なRNNも、実際のRNN６１として説明する。

最初に、ステップＳ３１において、RNN６１の入力層１１１のニューロン１１１−１は、所定の時刻ｔの入力ｘtを取り込む。ステップＳ３２において、RNN６１の中間層１１２は、入力ｘtに対して、重み付け係数に対応する演算処理を行い、出力層１１３のニューロン１１３−１から、入力された時系列パターンにおける時系列t+1の値の予測値ｘ*t+1を出力する。

ステップＳ３３において、演算部１２１は、次の時刻ｔ＋１の入力ｘt+1を教師データとして取り込む。ステップＳ３４において、演算部１２１は、ステップＳ３３の処理で取り込んだ教師入力ｘt+1と、ステップＳ３２の処理で演算して得た予測値ｘ*t+1の誤差を演算する。

ステップＳ３５において、RNN６１は、ステップＳ３４の処理で演算して得た誤差を出力層１１３のニューロン１１３−１から入力し、中間層１１２、さらに入力層１１１の順に伝搬（バックプロパゲーション）することで、学習処理を行い、演算結果dXbptを得る。

ステップＳ３６において、中間層１１２は、式（１）に基づいて、内部状態の修正値dXUを得る。

さらに、中間層１１２は、式（２）乃至式（４）に基づいて、修正値dXUを修正する。

ステップＳ３７において、パラメトリックノード１１１−２は、その内部状態の値を保存する処理を実行する。

次に、ステップＳ３８において、RNN６１は、学習処理を終了するか否かを判定し、まだ学習処理を終了しない場合には、ステップＳ３１に戻り、それ以降の処理を繰り返し実行する。

ステップＳ３８において、学習処理を終了すると判定された場合、学習処理が終了される。

以上のような学習処理を行うことで、仮想RNNに対して１つの運動パターンが学習される。

以上のようにして、学習パターンの数に対応する仮想RNNの学習処理が行われた後、その学習処理により得られた重み付け係数を、実際のRNN６１に設定する処理が行われる。図１９は、この場合の処理を表している。

演算部１２２は、ステップＳ５１において、仮想RNN毎に図１８のフローチャートに示される処理を実行した結果得られた係数の合成値を演算する。この合成値としては、例えば、平均値を用いることができる。すなわち、各仮想RNNの重み付け係数の平均値がここで演算される。

次に、ステップＳ５２において、演算部２２は、ステップＳ５１の処理で演算した合成値（平均値）を実際のRNN６１のニューロンに対して、重み付け係数として設定する処理を実行する。

これにより、実際のRNN６１の中間層１１２の各ニューロンに、複数の運動パターンを学習して得た係数が設定されることになる。

中間層１１２の各ニューロンの重み付け係数には、複数の教示運動パターンを生成する上で、共有可能な力学構造に関する情報が保持され、パラメトリックバイアスノードには、共有可能な力学構造を各教示運動パターンの生成に適した力学構造に切り替えるために、必要な情報が保持されることになる。

図８乃至図１０、図１１乃至図１３、並びに図１４乃至図１６の例では、それぞれ、振幅と周波数が異なるが、波形はほぼ相似形であることが、「共有可能な力学構造」とされている。

図２０は、以上のようにして、各ローカルモジュール４３−１乃至４３−３に運動パターンを学習させた場合の途中の状態を表わしている。図２０の状態においては、ローカルモジュール４３−１に、図９と図１０に示される運動パターンが既に学習されており、ローカルモジュール４３−２に、図１２と図１３に示される運動パターンが既に学習されており、ローカルモジュール４３−３に、図１４と図１５に示される運動パターンが既に学習されている。図２０は、図１１に示される運動パターンがさらに学習された状態を表わしている。

そして、ローカルモジュール４３−１の学習誤差は０．９であり、ローカルモジュール４３−２の学習誤差は０．１であり、ローカルモジュール４３−３の学習誤差は、０．４となっている。すなわち、最小の学習誤差を有しているのはローカルモジュール４３−２ということになる。

このことは、ローカルモジュール４３−１乃至４３−３のうち、図１１に示される運動パターンに、より似た運動パターン（図１２と図１３に示される運動パターン）を学習しているのは、ローカルモジュール４３−２であることを意味する。換言すれば、図１１乃至図１３に示される運動パターンが、それぞれ共有可能な力学構造を有していることを意味する。

この場合には、図７のステップＳ１４において、ローカルモジュール４３−２の学習誤差が最初であると判断されるため、ステップＳ１５において、ローカルモジュール４３−１とローカルモジュール４３−３に、学習パラメータ保存用バッファ１４１（図６の演算部１２２を構成する）に、ステップＳ１１の処理で保存されていた学習パラメータが再び戻されることになる。これにより、「共有可能な力学構造」を有しない運動パターンを学習することによりローカルモジュール４３−１とローカルモジュール４３−３の学習パラメータが実質的に破壊されてしまうようなことが防止される。

以上のようにして、学習が行われた後に、図４のステップＳ３において、実行される利用処理の例について、図２１のフローチャートを参照して説明する。

図２２に示されるように、ローカルモジュール４３−１には、図８乃至図１０に示される運動パターンが既に学習されており、ローカルモジュール４３−２には、図１１乃至図１３に示される運動パターンが既に学習されており、ローカルモジュール４３−３には、図１４乃至図１６に示される運動パターンが既に学習されている。

この状態において、ステップＳ７１において、図２２に示されるように、図１１に示される運動パターンを入力すると、ステップＳ７２において、各ローカルモジュール４３−１乃至４３−３は、ノード１１１−１で入力された運動パターンのデータに対して演算を行う。この例の場合、ローカルモジュール４３−１における認識誤差は０．９となる。これに対してローカルモジュール４３−２における認識誤差は０．１となり、ローカルモジュール４３−３における認識誤差は０．４となる。ローカルモジュール４３−２は、図１１に示される運動パターンを学習、記憶しているため、認識誤差は他のローカルモジュールに比べて小さくなる。

ステップＳ７３において、ローカルモジュール４３−１乃至４３−３は、ゲート４４−１乃至４４−３に、運動パターンに対応する演算結果を出力する。従って、統合モジュール４２の出力としては、これらの演算結果に係数W1乃至W3を乗算した値の合成値が出力される。

この場合におけるゲート４４−１乃至４４−３の係数W1乃至W3は、認識誤差に逆比例するように（認識誤差が小さい程ローカルモジュールの出力が大きい値で重み付けされるように）、重み付けされる。

さらに、この場合、ローカルモジュール４３−１乃至４３−３のパラメータは、それぞれＰ１，Ｐ２，Ｐ３となる。このうちの、ローカルモジュール４３−２のパラメータは、図１１に示される運動パターンにほぼ対応する値となる。

図２３は、図４のステップＳ３における利用処理の例としての運動パターンを生成する処理の例を表している。

最初に、ステップＳ９１において、各ローカルモジュール４３−１乃至４３−３のパラメトリックバイアスノード１１１−２は、それぞれ、学習時と異なる所定の値のパラメータを入力する。ステップＳ９２において、中間層１１２は、ステップＳ９１の処理で、パラメトリックバイアスノード１１１−２に入力されたパラメータに基づいて演算を行う。そして、ステップＳ９３において、RNN６１のニューロン１１３−１は、ステップＳ９１の処理で入力されたパラメータに対応するパターンのデータを出力する。各パターンのデータは、ゲート４４−１乃至４４−３により係数W1乃至W3が乗算された後、合成され、出力される。

図２４は、このようにして、運動パターンが生成される例を表わしている。図２４の例においては、ローカルモジュール４３−１乃至４３−３に、それぞれいままで学習していない運動パターンに対応する値のパラメータＰ１１乃至Ｐ１３が入力される。ゲート４４−１乃至４４−３の係数W1乃至W3は、それぞれのローカルモジュール４３−１乃至４３−３において演算された認識誤差に対応する値に設定される。その結果、運動パターンとして、いままでに学習された運動パターンに類似した運動パターンであって、学習したことのない運動パターンのデータが生成される。

この他、予め学習された運動パターンとの関係性に基づいて、運動パターンを分類することが可能である。

以上においては、ローカルモジュール４３を３個としたが、必要に応じてその数をもっと増加することが可能である。これにより、規模を拡張することが容易に可能となる。また、各ローカルモジュールを分散表現スキームによる運動パターン学習モデルとしてのRNNにより構成するようにしたので、複数の運動パターンを効率的に学習させることが可能となる。

また、以上においては、学習誤差が最小のローカルモジュールのみ学習を行う、いわゆるウィナーテークオール（Winner-Take-All）方式で学習するようにしたが、学習誤差の大きさに応じてローカルモジュールの学習を行うようにすることも可能である。図２５は、この場合の処理例を表している。

図２５において、ステップＳ１１１乃至Ｓ１１３の処理は、図７のステップＳ１１乃至Ｓ１３の処理と同様の処理である。すなわち、これらの処理により、ローカルモジュール４３−１乃至４３−３の学習パラメータが保存され、学習対象の運動パターンが各ローカルモジュール４３−１乃至４３−３に取り込まれる。そして、各ローカルモジュール４３−１乃至４３−３において、学習処理が実行される。

ステップＳ１１４において、各ローカルモジュール４３−１乃至４３−３は、学習誤差eiを算出する（ｉ＝１，２，３）。この学習誤差eiは、次式で表される。

上記式のd(t)は、学習する運動パターンを表し、o(t)は、学習の結果得られた出力パターンを表す。

次に、ステップＳ１１５において、各ローカルモジュール４３−１乃至４３−３は、それぞれの学習パラメータ修正量Δwiの重み付け係数giを、それぞれの学習誤差eiに基づいて演算する。この重み付け係数giは、次式で表される。

次に、ステップＳ１１６において、各ローカルモジュール４３−１乃至４３−３は、ステップＳ１１１の処理で保存しておいた学習前の学習パラメータを元に戻す処理を実行する。そして、ステップＳ１１７において、各ローカルモジュール４３−１乃至４３−３は、ステップＳ１１５の処理で求めた重み付け係数giに基づいて、ステップＳ１１６の処理で戻した学習前の学習パラメータを次式に基づいて修正する処理を実行する。

すなわち、ステップＳ１１３における学習処理で得られた学習パラメータの修正量Δwiが、上記式に基づいてΔw'iに修正される結果、学習誤差が小さいほどたくさん学習し、学習誤差が大きいほど少ない学習が行われることになる。換言すれば、この処理の場合、ステップＳ１１３において行われる学習処理は、学習誤差を得るためのものであり、実質的な学習はステップＳ１１７において行われる。

次に、ステップＳ１１８において、すべての運動パターンの学習が終了したか否かが判定され、まだ学習していない運動パターンが残っている場合には、ステップＳ１１１に戻り、それ以降の処理が繰り返し実行される。ステップＳ１１８において、全ての運動パターンの学習が終了したと判定された場合、この学習処理は終了される。

ローカルモジュール４３−１乃至４３−３のそれぞれが学習する運動パターンの相関性が低く、相互に独立しているような場合には、図７に示されるような、Winner-Take-All方式の学習処理を行うと学習効率が向上する。逆に、複数のローカルモジュールのそれぞれに、学習させた運動パターンと、ある程度相関を有する運動パターンを学習させるような場合には、図２５を参照して説明した学習処理を行うと学習効率が向上する。

以上においては、運動パターンを対象として本発明を説明したが、本発明は時系列パターン一般に適用することが可能である。運動パターン（時系列パターン）としてロボットの動作を規定するパターンを採用すれば、本発明は自律ロボットを制御するのに適用することができる。

上述した一連の処理は、ハードウエアにより実行させることもできるし、ソフトウエアにより実行させることもできる。この場合、例えば、図２６に示されるようなパーソナルコンピュータ１６０が用いられる。

図２６において、CPU（Central Processing Unit）１６１は、ROM（Read Only Memory）１６２に記憶されているプログラム、または記憶部１６８からRAM（Random Access Memory）１６３にロードされたプログラムに従って各種の処理を実行する。RAM１６３にはまた、CPU１６１が各種の処理を実行する上において必要なデータなども適宜記憶される。

CPU１６１、ROM１６２、およびRAM１６３は、バス１６４を介して相互に接続されている。このバス１６４にはまた、入出力インタフェース１６５も接続されている。

入出力インタフェース１６５には、キーボード、マウスなどよりなる入力部１６６、CRT，LCDなどよりなるディスプレイ、並びにスピーカなどよりなる出力部１６７、ハードディスクなどより構成される記憶部１６８、モデム、ターミナルアダプタなどより構成される通信部１６９が接続されている。通信部１６９は、ネットワークを介しての通信処理を行う。

入出力インタフェース１６５にはまた、必要に応じてドライブ１７０が接続され、磁気ディスク１７１、光ディスク１７２、光磁気ディスク１７３、或いは半導体メモリ１７４などが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部１６８にインストールされる。

一連の処理をソフトウエアにより実行させる場合には、そのソフトウエアを構成するプログラムが、パーソナルコンピュータ１６０に、ネットワークや記録媒体からインストールされる。

この記録媒体は、図２６に示されるように、装置本体とは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク１７１（フロッピディスクを含む）、光ディスク１７２（CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む）、光磁気ディスク１７３（ＭＤ（Mini-Disk）を含む）、もしくは半導体メモリ１７４などよりなるパッケージメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される、プログラムが記録されているROM１６２や、記憶部１６８に含まれるハードディスクなどで構成される。

なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。

従来のローカル表現スキームによる運動パターン学習モデルの例を示す図である。従来の分散表現スキームによる運動パターン学習モデルの例を示す図である。本発明を適用した処理装置の構成例を示すブロック図である。図３の処理装置の基本的処理を説明するフローチャートである。本発明を適用した処理装置の他の構成例を示すブロック図である。リカレント型ニューラルネットワークの構成例を示す図である。図４のステップＳ２における学習処理を説明するフローチャートである。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。運動パターンの例を示す図である。図５の処理装置の運動パターンを学習させた状態を示す図である。図７のステップＳ１３におけるローカルモジュール学習処理を説明するフローチャートである。係数設定処理を説明するフローチャートである。図５の処理装置に運動パターンを学習させる場合における学習誤差を説明する図である。運動パターンの認識処理を説明するフローチャートである。運動パターンを認識する処理を説明する図である。運動パターン生成処理を説明するフローチャートである。運動パターンを生成する処理を説明する図である。図４のステップＳ２における学習処理の他の例を説明するフローチャートである。本発明を適用したパーソナルコンピュータの構成例を示すブロック図である。

符号の説明

４１処理装置，４２統合モジュール，４３−１乃至４３−３ローカルモジュール，４４−１乃至４４−３ゲート，６１−１乃至６１−３リカレント型ニューラルネットワーク

Claims

時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、
前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルを要素とし、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルと
を備え、
前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成され、
前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルは、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの前記学習誤差についての指数関数と、前記指数関数の全ての運動パターン学習モデルについての和との比から演算し、前記重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、前記学習パラメータと前記重み付け係数との積を減じた値を、前記学習パラメータとするように、前記学習パラメータを修正する
情報処理装置。
時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルを要素とし、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置の情報処理方法において、
前記第１の運動パターン学習モデルが、複数の第１の時系列パターンを学習する第１の学習ステップと、
前記第２の運動パターン学習モデルが、複数の第２の時系列パターンを学習する第２の学習ステップと、
前記第３の運動パターン学習モデルが、時系列パターンを認識または生成する認識・生成ステップとを含み、
前記第１の学習ステップおよび前記第２の学習ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの前記学習誤差についての指数関数と、前記指数関数の全ての運動パターン学習モデルについての和との比から演算し、前記重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、前記学習パラメータと前記重み付け係数との積を減じた値を、前記学習パラメータとするように、前記学習パラメータを修正する
情報処理方法。
時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルを要素とし、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、
複数の第１の時系列パターンの学習を制御する第１の学習制御ステップと、
複数の第２の時系列パターンの学習を制御する第２の学習制御ステップと、
時系列パターンの認識または生成を制御する認識・生成制御ステップと
を含む処理をコンピュータに実行させ、
前記第１の学習制御ステップおよび前記第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの前記学習誤差についての指数関数と、前記指数関数の全ての運動パターン学習モデルについての和との比から演算し、前記重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、前記学習パラメータと前記重み付け係数との積を減じた値を、前記学習パラメータとするように、前記学習パラメータを修正する
プログラムが記録されているプログラム記録媒体。
時系列パターンを学習する、１つ以上のパラメータを持つ１つのモジュールが複数の運動パターンを学習するニューラルネットワークとしての、分散表現スキームによる第１の運動パターン学習モデルおよび分散表現スキームによる第２の運動パターン学習モデルと、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルを要素とし、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルが学習した時系列パターンに基づいて、新たに時系列パターンを認識または生成する、複数のモジュールがそれぞれ独立して運動パターンを学習するニューラルネットワークとしての、ローカル表現スキームによる第３の運動パターン学習モデルとを備え、前記第１の運動パターン学習モデルと前記第２の運動パターン学習モデルとは、それぞれ、運動パターンの力学構造をモジュレーションするためのパラメータを持つリカレント型ニューラルネットワークにより構成される情報処理装置を制御するコンピュータのプログラムであって、
複数の第１の時系列パターンの学習を制御する第１の学習制御ステップと、
複数の第２の時系列パターンの学習を制御する第２の学習制御ステップと、
時系列パターンの認識または生成を制御する認識・生成制御ステップと
を含む処理をコンピュータに実行させ、
前記第１の学習制御ステップおよび前記第２の学習制御ステップの処理は、学習する運動パターンと学習の結果得られた出力パターンとから学習誤差を演算するとともに、それぞれの運動パターン学習モデルについての学習パラメータ修正量の重み付け係数を、それぞれの運動パターン学習モデルの前記学習誤差についての指数関数と、前記指数関数の全ての運動パターン学習モデルについての和との比から演算し、前記重み付け係数に基づいて、それぞれの運動パターン学習モデルについての学習パラメータから、前記学習パラメータと前記重み付け係数との積を減じた値を、前記学習パラメータとするように、前記学習パラメータを修正する
プログラム。