JPH11126198A

JPH11126198A - データ処理装置および方法、並びに伝送媒体

Info

Publication number: JPH11126198A
Application number: JP9289692A
Authority: JP
Inventors: Atsushi Tani; 淳谷
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1997-10-22
Filing date: 1997-10-22
Publication date: 1999-05-11
Anticipated expiration: 2017-10-22
Also published as: JP3922407B2

Abstract

(57)【要約】【課題】時系列データのパターンを自動的に文節化で
きるようにする。【解決手段】リカレント型ニューラルネットワーク１
−１乃至１−ｎに、時系列データの所定のパターンを選
択的に記憶させ、入力された時系列データに学習したパ
ターンが現れたとき、その検出信号を出力させる。この
検出信号は、ゲート２−１乃至２−ｎを介して合成回路
３で合成される。ゲート２−１乃至２−ｎの開放状態に
対応するゲートシーケンスは、上位の階層のリカレント
型ニューラルネットワーク１１−１乃至１１−ｎに入力
される。各リカレント型ニューラルネットワーク１１−
１乃至１１−ｎは、記憶したパターンを検出すると、そ
の検出信号をゲート１２−１乃至１２−ｎを介して出力
する。このように、ネットワークを階層構造にすること
により、時系列データを自動的に文節化することができ
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、データ処理装置お
よび方法、並びに伝送媒体に関し、特に、時系列データ
を自動的に文節化し、処理することができるようにし
た、データ処理装置および方法、並びに伝送媒体に関す
る。

【０００２】

【従来の技術】データを処理する手法の中に、数理解
析、統計的手法、ニューラルネットなどがある。ジャコ
ブス（R.A.Jacobs）と、ジョーダン（M.I.Jordan）は、
module of experts networkにより、多様な空間的なパ
ターンを有限数のエキスパートに自動的に割り当てる形
で問題を分割し、かつ階層的に学習することを提案して
いる（Adaptive mixtures of local experts. Neural C
omputation, vol. 3, No.1,pp. 79-87,1991）。

【０００３】

【発明が解決しようとする課題】しかしながら、上記し
た提案においては、入力されたデータを時間方向に、自
動的に文節化する手段が開示されておらず、ロボットの
センサモータに代表される連続時系列データから、文節
化の構造を学習したり、その学習した構造から、元の時
系列を再構成することができないという課題があった。

【０００４】本発明はこのような状況に鑑みてなされた
ものであり、時系列データのパターンを階層的に学習
し、生成することができるようにするものである。

【０００５】

【課題を解決するための手段】請求項１に記載のデータ
処理装置は、入力される時系列データのパターンを判定
する複数の判定手段と、複数の判定手段の判定結果をそ
れぞれゲートする複数のゲート手段と、複数のゲート手
段の出力を合成する合成手段とを備えることを特徴とす
る。

【０００６】請求項５に記載のデータ処理方法は、入力
される時系列データのパターンを判定する複数の判定ス
テップと、複数の判定ステップの判定結果をそれぞれゲ
ートする複数のゲートステップと、複数のゲートステッ
プの出力を合成する合成ステップとを備えることを特徴
とする。

【０００７】請求項６に記載の伝送媒体は、入力される
時系列データのパターンを判定する複数の判定ステップ
と、複数の判定ステップの判定結果をそれぞれゲートす
る複数のゲートステップと、複数のゲートステップの出
力を合成する合成ステップとを備えるコンピュータプロ
グラムを伝送することを特徴とする。

【０００８】請求項１に記載のデータ処理装置、請求項
５に記載のデータ処理方法、および請求項６に記載の伝
送媒体においては、入力される時系列データのパターン
が判定され、判定結果がゲートされる。そして、ゲート
後の出力が合成される。

【０００９】

【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態（但し一例）を付
加して本発明の特徴を記述すると、次のようになる。但
し勿論この記載は、各手段を記載したものに限定するこ
とを意味するものではない。

【００１０】請求項１に記載のデータ処理装置は、入力
される時系列データのパターンを判定する複数の判定手
段（例えば、図１のリカレント型ニューラルネットワー
ク１−１乃至１−ｎ）と、複数の判定手段の判定結果を
それぞれゲートする複数のゲート手段（例えば、図１の
ゲート２−１乃至２−ｎ）と、複数のゲート手段の出力
を合成する合成手段（例えば、図１の合成回路３）とを
備えることを特徴とする。

【００１１】図１は、本発明を適用したデータ処理装置
の構成例を示している。このデータ処理装置は、例え
ば、ロボットなどに組み込まれるものである。そのロボ
ットには、障害物を検出するセンサと、ロボットを移動
させるために駆動されるモータ（いずれも図示せず）が
具備されている。

【００１２】ｎ個のリカレント型ニューラルネットワー
ク（RNN）１−１乃至１−ｎには、センサとモータの状
態に対応する入力ｘ_tが入力されている。

【００１３】図２は、リカレント型ニューラルネットワ
ーク１−１の構成例を表している。なお、図示は省略す
るが、他のリカレント型ニューラルネットワーク１−２
乃至１−ｎも、リカレント型ニューラルネットワーク１
−１と同様に構成されている。

【００１４】図２に示すように、リカレント型ニューラ
ルネットワーク１−１は、所定の数の入力層のニューロ
ン３１を有し、このニューロン３１に、センサの状態に
対応する入力ｓ_tと、モータの状態に対応する入力ｍ_tが
入力されている。ニューロン３１の出力は、中間層のニ
ューロン３２を介して、出力層のニューロン３３に供給
されるようになされている。そして、出力層のニューロ
ン３３からは、リカレント型ニューラルネットワーク１
−１のセンサの状態に対応する出力ｓ_t+1と、モータの
状態に対応する出力ｍ_t+1が出力されるようになされて
いる。また、出力の一部は、コンテキスト（context）
Ｃ_tとして、入力層のニューロン３１にフィードバック
されるようになされている。

【００１５】リカレント型ニューラルネットワーク１−
１乃至１−ｎの出力は、対応するゲート２−１乃至２−
ｎを介して合成回路３に入力され、合成され、予測出力
ｙ_t+ ₁が出力されるようになされている。

【００１６】学習時においては、教師信号としての目標
値ｙ^* _t+1と、各RNN１−１乃至１−ｎの出力の誤差が、
対応するゲート２−１乃至２−ｎの状態を制御するよう
になされている。

【００１７】以上の下位のRNN１−１乃至１−ｎ、ゲー
ト２−１乃至２−ｎ、および合成回路３と同様の構成
が、より上位の階層にも形成されている。すなわち、上
位の階層には、RNN１１−１乃至１１−ｎ、ゲート１２
−１乃至１２−ｎ、および合成回路１３が設けられてい
る。そして、RNN１１−１乃至１１−ｎには、下位の階
層のゲート２−１乃至２−ｎの導通状態（開閉度）に対
応するシーケンス（ゲートシーケンス）Ｇ_tが入力され
るようになされている。そして、各RNN１１−１乃至１
１−ｎからは、出力Ｇ¹ _T+1乃至Ｇⁿ _T+1が出力され、合成
回路１３からは、予測出力Ｇ_T+1が出力されるようにな
されている。また、学習時においては、教師信号とし
て、目標値Ｇ^* _T+1が入力されている。

【００１８】なお、図１には、２つの階層だけが示され
ているが、必要に応じて、さらに、より上位の階層を設
けることも可能である。

【００１９】図３は、上位の階層のRNN１１−１の構成
を表している。なお、他のRNN１１−２乃至１１−ｎ
も、RNN１１−１と同様の構成とされている。

【００２０】図３に示すように、RNN１１−１は、基本
的に、図２に示したRNN１−１と同様に構成されてお
り、入力層には複数のニューロン４１が、中間層には複
数のニューロン４２が、そして出力層には複数のニュー
ロン４３が配置されている。入力層には、ゲート２−１
乃至２−ｎの導通状態に対応する信号ｇ¹ _T乃至ｇⁿ _Tが入
力されるとともに、ゲートの導通（開放）している周期
（時間）Ｉ_Tが入力される。出力層からは、これらの入
力に対応して、出力ｇ¹ _T+1乃至ｇⁿ _T+1と、Ｉ_T+1が出力
される。また、出力層の出力の一部は、コンテキストＣ
_Tとして入力層にフィードバックされている。

【００２１】ここで、RNN１−１乃至１−ｎのアルゴリ
ズムについて説明する。ゲートの導通状態は、ソフトマ
ックス（soft-max）のアクティベーションファンクショ
ンを用いて、次式で示すように表される。

【００２２】

【数１】

【００２３】ここで、ｇⁱは、ｉ番目のゲートの導通状
態に対応するゲート係数を表し、ｓⁱは、ｉ番目のゲー
トの導通状態の内部状態に対応する値を表している。従
って、合成回路３の出力ｙ_t+1は、次式で表される。

【００２４】

【数２】

【００２５】ここで、予測学習時に最大の値となる次式
で示す尤度関数を定義する。

【００２６】

【数３】

【００２７】なお、ここで、σは、スケーリングパラメ
ータを表している。

【００２８】学習時、RNN１−１乃至１−ｎの重み係数
とゲート係数ｇは、尤度関数が最大となるように同時に
更新される。認識時においては、ゲート係数だけが更新
される。

【００２９】これらの重み係数とゲート係数を更新する
ルールを確立するために、尤度関数の指数関数の内部変
数ｓⁱに関する傾きと、ｉ番目のRNNの出力ｙⁱに関する
傾きを次式のように求める。

【００３０】

【数４】

【００３１】ここで、ｇ（ｉ｜ｘ_t，ｙ^* _t+1）は、ｉ番
目のRNNが入力ｘ_tのとき、目標出力ｙ^* _t+1を発生する事
象後確率を意味し、次式で表される。

【００３２】

【数５】

【００３３】ここで、||ｙ^* _t+1−ｙ^j _t+1||²は、現在の
予測の自乗誤差を表している。

【００３４】上記（４）式は、ｓⁱを更新する方向を表
している。また、（５）式に示されるように、尤度関数
の指数関数のｙⁱ _t+1に関する傾きは、誤差条件ｙ^* _t+1−
ｙⁱ _t ₊₁の誤差項を含んでいる。この誤差項は、ｉ番目の
RNNの事象後確率により重み付けされている。

【００３５】このように、RNN１−１乃至１−ｎの重み
係数は、事象後確率にのみ比例して、ｉ番目のRNNの出
力と目標値の誤差を補正するように調整される。これに
よりｎ個のRNNのうち、１つのエキスパートRNNだけが、
与えられたトレーニングパターンを排他的に学習するよ
うになされる。各RNNの誤差は、次式で表される。

【００３６】

【数６】

【００３７】RNN１−１乃至１−ｎの実際の学習は、上
記式で得られた誤差に基づいてバックプロパゲーション
法により実行される。

【００３８】これにより、RNN１−１乃至１−ｎは、入
力ｘ_tのうち、それぞれ他と異なる所定の時系列パター
ンを識別することができるエキスパートとなるように、
学習が行われる。

【００３９】以上のことは、より上位の階層におけるRN
N１１−１乃至１１−ｎにおいても同様である。ただ
し、この場合における入力は、ゲートシーケンスＧ_Tで
あり、その出力は、Ｇⁱ _T+1となる。

【００４０】このように構成したロボット５１で、図４
または図５に示すようなルームＡまたはルームＢを移動
させる実験を行った。図６は、図４のルームＡを２０方
向の距離センサを持つロボット５１が移動した場合にお
ける２０次元の距離センサの状態の時系列的な変化を表
している。図６においては、四角形の各ドットの大きさ
が、障害物までの距離の近さを表している（四角形が大
きいほど、距離が近い）。

【００４１】ロボット５１はルームＡとルームＢを移動
し、その間に下位層を自己組織化する。さらに、下位の
階層のネットワークにおける自己組織化を調べるため
に、図７に示すように、異なる形状のルームＣとルーム
Ｄが、ドア５２を介して連結されている空間を、ロボッ
ト５１に移動させる実験を行った。なお、ロボット５１
の各階層のRNN１−１乃至１−ｎとRNN１１−１乃至１１
−ｎの数は、それぞれ５個（ｎ＝５）とされている。

【００４２】図８は、ロボット５１がルームＣを移動し
た場合のモータへの入力（実線）と、５個のゲートの変
化を表している。同様に、図９は、ロボット５１がルー
ムＤを移動した場合のモータの入力と、各ゲートの変化
を表している。

【００４３】図８に示すように、ルームＣにおいては、
ゲート２−２は、ロボット５１が直進するとき開閉度が
高くなり、ゲート２−５は、ロボット５１が分岐点を通
過するとき開閉度が高くなり、ゲート２−１は、ロボッ
ト５１が左方向に曲がるとき開閉度が高くなる。図７に
示すように、ルームＣにおいては、ロボット５１は、最
初に直進するのでゲート２−２が先ず開放し、次に、分
岐点を通過するのでゲート４が開放し、次に、左方向に
曲がるのでゲート２−１が開放し、さらに、直進するの
でゲート２−２が開放し、また、左方向に曲がるのでゲ
ート２−１が開放し、直進するのでゲート２−２が開放
し、左に曲がるのでゲート２−１が開放し、さらに、直
進するのでゲート２−２が開放をする。以上により、ロ
ボット５１がルームＣを１周したことになる。

【００４４】従って、この場合は、RNN１−１が左に曲
がるパターンを記憶し、RNN１−２が直進するパターン
を記憶し、RNN１−５が分岐点のパターンを記憶してい
ることになる。

【００４５】一方、図９に示すように、ルームＤにおい
ては、ゲート２−１とゲート２−２は、図８におけるル
ームＣの場合と同様に、それぞれ左へ曲がる場合、また
は直進する場合にそれぞれ開放し、ゲート２−４は、右
に曲がる場合に開放する。従って、RNN１−４は、右に
曲がる場合のパターンを記憶していることになる。

【００４６】図１０は、上位の階層のゲート１２−１乃
至１２−５の開放状態を表している。同図に示すよう
に、ルームＣにおけるロボット５１の移動は、ゲート１
２−２とゲート１２−４の開放の繰り返しとして認識さ
れ、ルームＤにおける移動は、ゲート１２−５の開放と
して認識されている。

【００４７】このように、より上位の階層のRNN１１−
１乃至１１−ｎでは、ルーム単位の識別も可能となる。

【００４８】図１１は、各ゲートの開放している周期Ｉ
_T（実線）と予測誤差（破線）の変化を表している。ル
ームＣからルームＤに、ステップＳ３６で移動すると
き、予測誤差が大きくなっているが、それより前、ある
いはそれより後においては、予測誤差の値は小さくなっ
ている。

【００４９】上位の階層のRNN１１−１乃至１１−ｎ
で、ゲート係数の時系列を学習させる場合、ゲート係数
の時系列データは滑らかに変化するので、その特徴を抽
出し、学習させてもよい。また、ゲートの開放する時間
を学習させるようにしてもよい。

【００５０】例えば、ゲート１２−１乃至１２−３の開
閉度が、図１２に示すように、時間の経過にともなって
変化するとき、、各ゲートのうち、１つのゲートがウィ
ナーとなったとき、そのウィナーとなっている時間をテ
ーブルに表すと、図１３に示すようになる。同図に示す
ように、ステップＳ１においては、ゲート１２−１がウ
ィナーとなり、その時間は２０秒である。また、ステッ
プＳ２において、ゲート１２−２がウィナーとなり、そ
の時間は３０秒であり、ステップＳ３においては、ゲー
ト１２−３がウィナーとなり、その継続時間は４０秒で
ある。

【００５１】この図１３のデータは、図１４に示すよう
に、正規化して表すことができる。同図において、ゲー
トのウィナーは１．０で表され、時間は、単位時間（１
００秒）に対する割合として示されている。

【００５２】このような絶対時間または正規化した時間
を学習させるようにしてもよい。

【００５３】上記実施の形態においては、RNNを用い
て、時系列データのパターンを判定（記憶）するように
したが、例えば、図１５に示すように、RNN１−１乃至
１−ｎに代えて、回帰型多変量解析の処理を行うモジュ
ール６１−１乃至６１−ｎを用いるようにしてもよい。
すなわち、モジュール６１−ｉは、次式を演算する。

【００５４】

【数７】

【００５５】ここで、ｆは非線形関数であり、Ｗは所定
の係数である。

【００５６】例えば、ｘ_t+1＝ａｘ² _t＋ｂｘ_t＋ｃの式で
表すこともできる。この場合、ａ，ｂ，ｃが、係数Ｗに
対応する。

【００５７】あるいはまた、各モジュールの行う演算式
を（９）式のように、差分方程式で表したり、（１０）
式で示すように、微分方程式で表現することもできる。

【００５８】

【数８】

【数９】

【００５９】以上の実施の形態においては、時系列に出
力されるロボットのデータを処理する場合を例として説
明したが、例えば、図１６に示すように、時々刻々と変
化する楽音信号を、各パターンＰ１，Ｐ２，Ｐ１，Ｐ
３，Ｐ２のように、自動的に順次文節化することができ
る。すなわち、上記した各RNN１−１乃至１−ｎが、こ
れらのパターンＰ１，Ｐ２，Ｐ３，・・・をそれぞれ選
択的に記憶し、入力される時系列データから記憶したパ
ターンを検出したとき、検出信号を対応するゲートを介
して出力することになる。このようにして、例えば、音
楽の所定のフレーズを学習し、これを検出することが可
能となる。

【００６０】また、以上の原理を利用して、楽音信号を
合成することも可能である。図１７は、この場合の構成
例を表している。

【００６１】すなわち、同図に示すように、この構成例
においては、合成回路３の出力が、RNN１−１乃至１−
ｎに帰還されている。また、上位の階層においても、合
成回路１３の出力が、RNN１１−１乃至１１−ｎに帰還
されている。そして、下位のゲート２−１乃至２−ｎ
は、上位の階層の合成回路１３の出力で、その開閉度が
制御される。RNN１−１乃至１−ｎ，１１−１乃至１１
−ｎに所定のパターンを記憶させることで、例えば、図
１６に示したパターンＰ１をRNN１−１に発生させ、パ
ターンＰ２をRNN１−２に発生させ、パターンＰ３をRNN
１−３（図示せず）に発生させることができる。いずれ
のパターンを発生させるかは、上位の階層のゲートシー
ケンスで制御される。

【００６２】この図１７の構成をロボットに応用すれ
ば、そのロボットは、実際に移動を行わなくても、移動
を連想することができることになる。

【００６３】本発明は、このほか、例えば、人間の動き
を学習し、コンピュータシステム上のエージェントに学
習させ、同一の動きを生成する場合にも、応用すること
が可能である。

【００６４】なお、上記したような処理を行うコンピュ
ータプログラムをユーザに伝送する伝送媒体としては、
磁気ディスク、CD-ROM、固体メモリなどの記録媒体の
他、ネットワーク、衛星などの通信媒体を利用すること
ができる。

【００６５】

【発明の効果】以上の如く、請求項１に記載のデータ処
理装置、請求項５に記載のデータ処理方法、および請求
項６に記載の伝送媒体によれば、入力される時系列デー
タのパターンを判定し、その判定結果をゲートし、ゲー
ト後の出力を合成するようにしたので、時系列データの
パターンを時間方向に文節化し、検出処理することが可
能となる。

【図面の簡単な説明】

【図１】本発明のデータ処理装置の構成例を示すブロッ
ク図である。

【図２】図１のRNN１−１の構成例を示す図である。

【図３】図１のRNN１１−１の構成例を示す図である。

【図４】ロボットの移動するルームの例を示す図であ
る。

【図５】ロボットの移動するルームの例を示す図であ
る。

【図６】ロボットの移動に対応して発生する時系列のデ
ータを示す図である。

【図７】ロボットの移動するルームの例を示す図であ
る。

【図８】ロボットが図７のルームＣを移動した場合のゲ
ートの変化を示す図である。

【図９】ロボットが図７のルームＤを移動した場合のゲ
ートの変化を示す図である。

【図１０】ロボットが図７のルームＣとルームＤを移動
した場合の上位の階層のゲートの開閉度の変化を示す図
である。

【図１１】ロボットが図７のルームＣとルームＤを移動
した場合のゲートの開放している時間の周期の変化と予
測誤差の変化を示す図である。

【図１２】ゲートの開閉度の変化を示す図である。

【図１３】図１２の開放しているゲートとその開放時間
の対応関係を表す図である。

【図１４】図１３の対応関係を正規化した状態を示す図
である。

【図１５】本発明のデータ処理装置の他の構成例を示す
図である。

【図１６】音声データの変化を示す図である。

【図１７】本発明のデータ処理装置のさらに他の構成例
を示すブロック図である。

【符号の説明】

１−１乃至１−ｎリカレント型ニューラルネットワー
ク，２−１乃至２−ｎゲート，３合成回路，
１１−１乃至１１−ｎリカレント型ニューラルネット
ワーク，１２−１乃至１２−ｎゲート，１３合
成回路

Claims

【特許請求の範囲】

【請求項１】入力される時系列データのパターンを判
定する複数の判定手段と、複数の前記判定手段の判定結果をそれぞれゲートする複
数のゲート手段と、複数の前記ゲート手段の出力を合成する合成手段とを備
えることを特徴とするデータ処理装置。
【請求項２】前記判定手段、ゲート手段、および合成
手段は、階層構造とされていることを特徴とする請求項
１に記載のデータ処理装置。
【請求項３】前記判定手段は、リカレント型ニューラ
ルネットワークであることを特徴とする請求項１に記載
のデータ処理装置。
【請求項４】前記判定手段は、回帰型多変量解析によ
り判定を行うことを特徴とする請求項１に記載のデータ
処理装置。
【請求項５】入力される時系列データのパターンを判
定する複数の判定ステップと、複数の前記判定ステップの判定結果をそれぞれゲートす
る複数のゲートステップと、複数の前記ゲートステップの出力を合成する合成ステッ
プとを備えることを特徴とするデータ処理方法。
【請求項６】入力される時系列データのパターンを判
定する複数の判定ステップと、複数の前記判定ステップの判定結果をそれぞれゲートす
る複数のゲートステップと、複数の前記ゲートステップの出力を合成する合成ステッ
プとを備えるコンピュータプログラムを伝送することを
特徴とする伝送媒体。