JPH10185589A

JPH10185589A - 学習型自己定位装置

Info

Publication number: JPH10185589A
Application number: JP8347705A
Authority: JP
Inventors: Masahiro Matsuoka; 雅裕松岡; Shinya Hosoki; 信也細木; Yoshiharu Maeda; 芳晴前田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1996-12-26
Filing date: 1996-12-26
Publication date: 1998-07-14
Anticipated expiration: 2016-12-26
Also published as: US6018696A; JP3647584B2

Abstract

(57)【要約】【課題】ロボットや自動車などの移動体の位置決定方
式に関し、移動空間内において自己が存在する位置を自
律的に定位することができる学習型自己定位装置を提供
する。【解決手段】移動空間における移動体の原点からの相
対位置に対応する回帰情報を求める手段１と、移動体の
該相対位置における環境状況に対応する感覚情報を求め
る手段２と、回帰情報と感覚情報との相関を学習して２
つの情報を統合した後に、手段２から出力される感覚情
報に対応する回帰情報を想起する手段３とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は自律ロボットや自動
車などの移動体の位置決定方式に係り、更に詳しくは学
習によって移動空間内において自己が存在する位置を自
律的に定位することができる学習型自己定位装置に関す
る。

【０００２】

【従来の技術】移動体の位置決めの問題は、ロボットや
自動車などの運動の自律化を達成するための基礎技術の
１つとして研究されている。通常、移動体の運動に関す
る情報、または絶対的な位置が分かる手掛かりとの相対
的な位置に関する情報から、移動体の位置の計算が行わ
れる。その技術は次の文献１に述べられており、次のよ
うにまとめることができる。

【０００３】文献１：日本ロボット学会編、ロボット工
学ハンドブック、コロナ社（1990）第１の技術はデットレコニングと呼ばれる方法である。
移動経路上での移動体と移動面との接触に関する情報か
ら、移動体の相対位置を推定する方法である。移動体の
平行移動は車輪の回転エンコーダや車輪速度センサ、オ
ドメータなどを利用して測定され、移動体の移動方向の
変化は、差動車輪の回転計算や、コンパスを利用して測
定される。そのような測定結果を積算することにより、
原点からの移動体の距離と方向が求められる。

【０００４】第２の技術は慣性航行を利用する方法であ
る。この方法では、慣性座標系に対する運動計測が可能
な加速度センサと角速度センサとが組合わされて、位置
の推定が行われる。角速度センサの代わりに、絶対方位
を正確に検出できるジャイロコンパスを用いることによ
って、高精度の位置推定が可能となる。

【０００５】第３の技術はビーコンシステムにおける三
角測量を用いる方法である。この方法では、移動空間内
に設けられたそれぞれのランドマークから移動体までの
距離、移動体を中心としたランドマークの間の相対的な
角度、およびランドマークの位置情報から、ランドマー
クの座標系における移動体の位置の計算が行われる。

【０００６】この３つの方式には、位置決めに用いられ
る情報に応じて、様々な長所および短所がある。本発明
においては、位置決めに用いられる情報を回帰情報と感
覚情報に分けて、位置決めの問題を説明する。回帰情報
は移動体の運動に関する情報であり、移動体の運動状態
を計測するセンサの信号を処理することによって得ら
れ、感覚情報は移動体の環境に関する情報であり、例え
ばランドマークまでの距離や角度を計測するセンサ、絶
対方位を検知するセンサの信号を処理することによって
得られる。

【０００７】第１の方法としてのデッドレコニングは回
帰情報を利用する方式であり、長所としてはシステムが
安価であり、移動経路がスリップなどが行らない良い状
態であれば位置決めの誤差は小さくなる。これに対して
短所としては、車輪のスリップによる誤差が累積するた
め、路面状態に応じた補正が必要であることがあげられ
る。

【０００８】第２の方法としての慣性航行に基づく場合
には、回帰情報だけを利用する場合、すなわち機械式ジ
ャイロによって相対方位を検出する場合と、回帰情報と
感覚情報との両方を利用する場合、すなわちジャイロコ
ンパスによって絶対方位を検出する場合とがある。

【０００９】第１の場合の回帰情報だけを利用する場合
の長所としては、慣性航行では速度センサ、加速度セン
サにより運動状態を測定して回帰情報を生成するので、
移動体の車輪と接触面の滑りによる誤差の累積を防ぐこ
とができることがあげられ、短所としては運動状態を計
測するセンサ信号の微小な誤差が累積すること、特に角
度情報の精度が問題になることがあげられる。機械的よ
りも光ファイバ式のジャイロを用いる方が精度が高く、
かつ小型になる。

【００１０】回帰情報と感覚情報との両方を利用する場
合の長所としては、移動体の動輪と接触面の滑りによる
誤差の累積を防ぐことができ、また絶対方位を利用する
ことで正確な角度情報が得られるので、位置決めの性能
を大幅に改善することができることがあげられる。短所
としては超精密な装置が必要であり、値段が高いこと、
また一般的に反応の時定数が大きく、小型のシステムに
は向いていないことがあげられる。

【００１１】第３の方法としての三角測量を用いる方法
は感覚情報を利用するものである。その長所としては、
累積誤差の問題がないことがあげれらる。これに対して
短所としては、マップ、ビーコン、ランドマークなど環
境の情報（ランドマークの位置情報が明記された地図）
をシステム設計の段階であらかじめ与える必要があり、
その地図の精度によって位置決めの精度が決定されてし
まうことがあげられる。

【００１２】

【発明が解決しようとする課題】以上に述べた３つの方
法は、自律型ロボットの位置決めに対して、１つだけを
選んで単独で使うことはできない。まず第１および第２
の方法は、基本的には回帰情報を用いて経路を積算する
ものである。従って移動体を本来の移動方法をとること
なく任意の別の地点に運んだ場合、例えば自動車をトレ
ーラに乗せて任意の地点に運んだ場合に位置の情報が失
われ、位置決めを行うことができないという問題点があ
る。経路を積算する方法を用いる場合には、経路が連続
である限りは原点への直線距離と方位を情報として保持
できるが、経路が切断された場合にはそのような情報を
保持することができない。

【００１３】第２の方法においてジャイロコンパスを利
用することが可能であったとしても、絶対方位は各地点
で等方性の情報であるため、位置情報の修正には用いる
ことができない。すなわち絶対方位として北の方向が示
されたとしても、その情報だけでは位置情報を修正する
ことができない。同様の意味で運動状態の信号に含まれ
る誤差の累積を修正することができないという問題点が
ある。

【００１４】第３の方法としての感覚情報を用いた三角
測量法においては、システム設計者、もしくはユーザ
が、ロボットが置かれる環境の地図情報をあらかじめ与
えなければならないという問題点がある。更に環境が動
的に変化した場合に、地図情報の修正が必要になる。こ
のことは自律的な位置決めができないということを意味
し、更にランドマークが利用できないような状況では、
位置の確認をすることすら全くできないという問題点が
ある。

【００１５】本発明は、回帰情報と感覚情報の両方を用
いて学習によって両方の情報を統合し、位置決めを自律
的に行うことができる学習型自己定位装置を提供するこ
とを目的とする。

【００１６】

【課題を解決するための手段】図１は本発明の原理構成
ブロック図である。同図は移動体、例えばロボットが移
動空間内における自己の位置を定位するために、移動空
間における移動体に対する座標系を内的に生成して、移
動空間における自己を自律的に定位する学習型自己定位
装置の原理構成ブロック図である。

【００１７】図１において、回帰情報処理手段１は例え
ば回帰情報処理部であり、移動空間における移動体、例
えばロボットの原点からの相対位置を示す回帰情報を求
めるものである。感覚情報処理手段２は、その相対位置
における移動体の環境状況に対応する感覚情報を求める
ものである。また情報統合手段３は、回帰情報処理手段
１の出力する回帰情報と、感覚情報処理手段２の出力す
る感覚情報との相関を学習して、これら２つの情報を統
合した後に、移動体が移動空間内の任意の位置から原点
まで回帰するナビゲーションなどの実行に際して、感覚
情報処理手段２から出力される感覚情報に対応する回帰
情報を想起して出力するものである。

【００１８】回帰情報処理手段１は、移動体の運動状態
を示す運動信号、例えば単位時間内における移動体の移
動距離と、移動方向の変化量を示す信号を逐次積算し
て、移動体の移動経路上における回帰情報を求め、その
結果を情報統合手段３に出力する。

【００１９】また、感覚情報処理手段２は、移動空間内
の任意の位置において、移動体を取り巻く環境の観測結
果に基づいて求められる感覚信号、例えばセンサから入
力される、移動体と複数のランドマークとの間の距離を
示す信号を離散・局在化させた結果としての感覚信号
と、量子化された感覚信号空間において分割された各領
域の代表点との距離に対応する値を、感覚情報として情
報統合手段３に出力する。

【００２０】情報統合手段３は、学習時においては、例
えば任意の点に対する感覚信号と各領域の代表点との距
離に対応する値の入力に対して、情報統合手段３の内部
で各領域の代表点との距離に対応するそれぞれの値のう
ちで最大値が入力される結合の荷重として、その任意の
点に対応する回帰情報の値を学習し、実行時においては
前述の距離に対応する値の入力に対して、各領域の代表
点に対応する移動空間内の各点の回帰情報の値を用い
て、補間によって任意の点に対する回帰情報を想起す
る。

【００２１】本発明においては、このように経路積算に
よって得られる回帰情報と、感覚信号空間、すなわち感
覚信号マップを用いて得られる感覚情報とを統合するこ
とによって、移動体の位置決めが自律的に行われる。こ
れらの情報の統合に際しては、回帰情報および感覚情報
が相互に参照・想起できるような形式で、統合が行われ
る。本発明の情報統合を用いた移動体の位置情報の計算
方式ては、感覚情報によって空間が符号化され、回帰情
報によって各符号の位相、すなわち各符号に対する移動
空間内の点の間の距離を決めることになる。従って同じ
情報を異なる方式で二重に処理していることにはなら
ず、移動体の自律的な位置決め、例えば自律型ロボット
における位置決め問題を解決することが可能になる。

【００２２】

【発明の実施の形態】図２は本発明の学習型自己定位装
置の全体構成ブロック図である。同図において学習型自
己定位装置１０は、センサ１１から入力される運動状態
を示す信号に応じて符号化された回帰信号、すなわち回
帰情報を求める回帰情報処理部１２、センサ１３からの
環境を示す感覚信号の入力に応じて、符号化された感覚
信号、すなわち感覚情報を求める感覚情報処理部１４、
回帰情報処理部１２から入力される符号化された回帰信
号、すなわち回帰情報、および感覚情報処理部１４から
出力される符号化された感覚信号、すなわち感覚情報を
統合して、その結果を移動体、例えばロボットの駆動制
御装置１５に位置情報、すなわち後述する回帰ベクトル
として出力する情報統合部１６から構成されている。こ
こで情報統合部１６は、感覚情報をキーとする回帰情報
の想起を行うことも、またその逆に回帰情報をキーとす
る感覚信号の想起を行うこともできる。

【００２３】図１において、回帰情報処理部１２はセン
サ１１から与えられる運動状態を表す信号を運動信号に
符号化し、各単位時間における移動距離と方向の変化量
とを積算することによって、原点に対する移動体の現在
位置の相対距離と方位を常に計算し、適切な表現として
の回帰情報に変換した後に情報統合部１６に出力する。

【００２４】感覚情報処理部１４は、センサ１３からの
信号を感覚信号空間上の点に対応するように符号化し、
ロボットの移動空間内の複数の代表点に対応して、感覚
信号空間上の代表点に相当する感覚信号のプロトタイプ
を生成し、その後生成されたプロトタイプに基づいて、
移動空間内の任意の点に対応すセンサ信号から符号化さ
れた感覚信号に独自の表現としての感覚情報を与え、情
報統合部１６に出力する。

【００２５】情報統合部１６は、回帰情報処理部１２お
よび感覚情報処理部１４の出力を、学習によって相互に
想起できるように統合する。この学習の終了後に、感覚
情報処理部１４から出力される感覚情報を用いて、移動
空間内の任意の点における位置情報を回帰情報として想
起することが可能になり、想起さた回帰情報、後述する
回帰ベクトルはロボットなどの駆動制御装置１５に与え
られる。

【００２６】図２の回帰情報処理部１２では、前述のよ
うに移動体の移動経路に沿って得られる運動状態の信号
を積算して移動体、例えばロボットの現在の位置から原
点までの直線距離ｕ、および方向φに対応する情報を時
々刻々計算し、その計算結果を保持する。この情報をロ
ボットが現在の位置から原点まで回帰するための情報と
して、回帰情報ｈ（ｕ，φ）と呼ぶことにする。この回
帰情報を表現するために、一般的なベクトルの代わりに
三角関数を用いた表現位相符号（フェーザコーディン
グ）を使用して、回帰情報を次式のように表す。

【００２７】ｈ（ｕ，φ）＝ｕcos （ωｋ＋φ） (1) ここでωは符号化のために用いる周波数である。このよ
うに回帰情報の表現のためにフェーザコーディングを使
用することについては、次の文献がある。

【００２８】文献２：細木信也、松岡雅裕、前田
芳晴、学習型ベクトル演算装置、特願平８−１９７５５
６号文献３：D.S. Touretzky他、Neural Representation of
Space using Sinusoidal Arrays, Neural Computatio
n, Vol.5, pp.869 〜884 (1992) 文献２は出願人の先願であるが、この先願において出願
人はフェーザコーディングを用いた回帰情報の積算につ
いて開示している。このような方法は、回帰情報をベク
トルで直接表現する場合に比べて、まず平行移動および
回転移動を簡単な操作で実現でき、また簡単な回路、す
なわち加算器を用いて高精度の積算器を構成でき、更に
離散化によって分散表現が可能となるため、符号器や積
算器をより簡単な回路で構成できるなどの利点がある。

【００２９】ロボットの方向、すなわち方位の表現方法
としては、絶対方位を用いる方法と相対方位を用いる方
法との２通りがある。後者の相対方位は、例えばロボッ
トの直進方向を基準とした、ロボットに貼り付けられた
座標（慣性座標系）上における方位を表す。前者の絶対
方位は、例えば北を基準とする移動平面上での方位を表
現するものである。感覚情報として絶対方位を利用する
ことができれば、回帰情報をよりコンパクトに表現する
ことかできる。

【００３０】そこで最初に絶対方位による回帰情報の積
算について説明する。絶対方位の情報を用いる場合に
は、時刻ｔにおける回帰情報は次式で表される。ｈ（ｕ(t) ，φ(t))＝ｕ(t) cos(ωｋ＋φ(t)) (2) ここで、ロボットが単位時間に絶対方位でΔφの方向
に、距離Δｕだけ移動した場合の回帰情報の修正量は次
式で与えられる。

【００３１】 Δｈ（ｕ(t),φ(t))＝Δｕ cos（ωｋ＋Δφ) (3) その結果、時刻ｔ＋１における回帰情報は次の(4) 〜
(6) 式で与えられ、これらの式から時刻ｔ＋１における
距離と方位は(7) および(8) 式によって与えられる。

【００３２】

【数１】

【００３３】回帰情報処理部１２においては、以上の計
算が時々刻々行われ、，その結果としての回帰情報が保
持される。回帰情報の積算をより効率的に行うために、
位相符号をＮ次元のコサインベクトル（ここでは、“Si
nusoidal Array”をコサインベクトルと呼ぶことにす
る）に変換し、その上で積算操作を行う方法がある。位
相符号を離散化してコサインベクトルに変換することに
よって、位相符号とユニークに対応するＮ次元のコサイ
ンベクトルを用いた回帰情報の表現が得られる。回帰情
報処理部１２による回帰情報の更新動作は次の(1) 〜
(4) のように行われる。 (1) センサから伝達されるロボットの運動状態に関する
信号を基にして、単位時間における移動方向Δφと移動
距離Δｕを算出する。 (2) この単位時間に対応する回帰情報の修正量をＮ次元
コサインベクトルとして、次式のように求める。

【００３４】

【数２】

【００３５】(3) コサインベクトルとして保持されてい
る時刻ｔにおける回帰情報

【００３６】

【数３】

【００３７】を読み出す。 (4) 時刻ｔ＋１の回帰情報を求めるために、コサインベ
クトルの各要素（ｉ＝１，・・・，Ｎ）について次式の
計算を行う。

【００３８】

【数４】

【００３９】(5) 保持されている回帰情報を時刻ｔのも
のから時刻ｔ＋１のものに更新する。次に相対方位を用
いた回帰情報の更新について説明する。この場合も、原
理的には絶対方位を用いる場合と同じであるが、回帰情
報を表現するためにサイン関数とコサイン関数とを一対
にして用いる。これはロボットの向きに関する操作が必
要となるためである。相対方位による積算においては、
ロボットの車体の運動状態を微小時間における旋回と並
進とに分解し、それぞれの動作に応じて回帰情報の更新
が行われる。

【００４０】相対方位を用いる場合には、ロボットの車
体に貼り付けられた極座標系において回帰情報はｈ（ｕ
(t),Ψ(t))と表される。この回帰情報の表し方につい
て、図３を用いて説明する。方位Ψはロボットの進行方
向（移動体の表面に対して垂直で、かつ移動体の重心を
通る車体軸）と、原点と移動体の重心とを結ぶ線分とが
成す角を、左回りで０から２πの範囲で表すものとす
る。角度の表現としては、例えばロボットの向きに対し
て左回りに０からπ、右回りに０からπという形式など
も利用できる。角度の表現に応じた場合分けを行えば、
以下の説明は基本的に成立する。移動体の重心と原点と
の間の距離はｕ(t) で表される。

【００４１】時刻ｔにおける回帰情報は次式によって表
される。 h(u(t), Ψ(t))＝(u(t)cos( ωｋ＋Ψ(t))，u(t)sin(ωｋ＋Ψ(t))) (12) 図３(a) は時刻ｔでの旋回による方向Ψの更新の説明図
である。同図に示すように、時刻ｔにおいて車体軸がΔ
Ψだけ旋回したとすると、方位はΨ′となり、回帰情報
は次式のように与えられる。

【００４２】 u(t)cos(ωｋ＋Ψ′(t))＝u(t)cos(ωｋ＋Ψ(t) −ΔΨ) (13) u(t)sin(ωｋ＋Ψ′(t))＝u(t)sin(ωｋ＋Ψ(t) −ΔΨ) (14) ここで旋回に対しては時刻ｔをｔ＋１に更新せず、次に
説明する並進を含めて時刻の更新が行われる。

【００４３】(13)および(14)式を行列表現を用いて書き
直すと次式が得られる。

【００４４】

【数５】

【００４５】時刻ｔでの並進による位置情報の更新を図
３(b) を用いて説明する。移動体が、ΔΨの旋回の後
に、車体軸の方向に対してΔθの方向にΔｕだけ移動し
たとすると、時刻ｔ＋１における回帰情報は次式のよう
に与えられる。

【００４６】

【数６】

【００４７】この移動後の時刻ｔ＋１における移動体の
位置が、図３(c) に示されている。相対方位を用いる場
合にも、位相符号を離散化することによって、位相符号
にユニークに対応するＮ次元のコサインベクトルと、Ｎ
次元サインベクトルが回帰情報の表現として得られる。
この場合には、回帰情報の更新は次の(1) 〜(6) の順序
で行われる。 (1) 絶対方位を用いる場合と同様に、センサから伝達さ
れるロボットの運動信号を基にして、単位時間における
旋回角ΔΨ、移動方向Δθ、および移動距離Δｕを算出
する。 (2) 旋回を表す行列と、並進による修正に必要なＮ次
元コサインベクトルとＮ次元サインベクトルを、次式に
よって求める。

【００４８】

【数７】

【００４９】(3) 時刻ｔにおける回帰情報を表すＮ次元
コサインベクトルとＮ次元サインベクトルを読み込む。

【００５０】

【数８】

【００５１】(4) 車体の旋回ΔΨによる回帰情報の修正
として、コサインベクトルとサインベクトルの各要素
（ｉ＝１，・・・，Ｎ）に対して次式を計算する。

【００５２】

【数９】

【００５３】(5) 旋回の修正が成されたコサインベクト
ルとサインベクトルの各要素について、次式によって並
進による修正を行う。

【００５４】

【数１０】

【００５５】(6) 回帰情報を時刻ｔから時刻ｔ＋１のも
のに更新する。次に回帰情報処理部１２による処理につ
いて図４を用いて説明する。同図において、センサによ
って得られる方位は、ステップＳ１においてガウス・フ
ィルタを用いて離散・局在化され、離散ガウス関数信号
が得られる。この離散ガウス関数信号の求め方について
は詳しく後述する。

【００５６】続いてステップＳ２で、この離散ガウス関
数信号を用いてコサインベクトルとしての方位情報が復
元され、離散コサイン関数信号が得られる。ステップＳ
３でこの離散コサイン関数信号と単位時間移動距離とが
乗算されて、移動ベクトルが復元される。この単位時間
移動距離の乗算は、例えば(9) 式におけるΔｕとコサイ
ン関数との積に相当する。

【００５７】ステップＳ３で単位時間における移動ベク
トルが復元されると、その結果はステップＳ４で１単位
時間前の回帰ベクトル、すなわちコサインベクトルとベ
クトル加算器によって加算去れ、回帰ベクトルの更新が
行われ、新しい回帰情報が、離散コサイン関数信号によ
る回帰ベクトルとして得られる。更にこの回帰情報は、
１単位時間後のベクトル加算器による加算に備えて、ス
テップＳ５で短期保持されると共に、例えばノイズ除去
が行われる。

【００５８】図４における処理のうちステップＳ１、す
なわちガウス・フィルタによる方位の離散・局在化につ
いて、図５〜図９を用いて説明する。図５は方位角を離
散ガウス関数信号に変換するニューラルネットの例であ
る。このニューラルネットは、方位角θを０から２πの
範囲でニューロンの出力強度に変換し、ニューラルネッ
トの出力パターンとして空間的な符号化を行うものであ
る。各ニューロンＣ１〜Ｃ４は荷重と入力を比較し、比
較結果に基づいて出力を決定する。図５では一次元の信
号としての方位角θが、４つのニューロンの出力として
の四次元の信号に変換されており、センサ信号の次元拡
大が行われている。

【００５９】図６は４つのニューロンＣ１〜Ｃ４の出力
強度を示す。同図に示すように、４つのニューロンはそ
れぞれに与えられた荷重に応じて４つのガウス型の受容
野を持ち、入力の方位角に応じた出力を与えることにな
る。各ニューロンの荷重ｍ_i（ｉ＝１，２，３，４）は
Ｃ１に対してはπ／４，Ｃ２に対しては３π／４、Ｃ３
に対しては５π／４、Ｃ４に対しては７π／４に設定さ
れており、受容野を決める出力関数ｆ_i（ｉ＝１，２，
３，４）は次式によって与えられている。また出力関数
の形状を決める分散の値は、方位角の情報ができる限り
歪まないように選ばれ、ここでは１ラジアンに設定され
ている。

【００６０】ｆ_i＝exp 〔0.5(θ−ｍ_i）²〕（ｉ＝１，２，３，４） (25) 図７は方位角としてθ＝４π／５が入力された時の各ニ
ューロンの出力強度比率を示す。この比率ｑ_i（ｉ＝
１，２，３，４）は各ニューロンの出力を全体の出力の
総和で規格化したものである。それぞれのニューロンの
出力比率は次のようになり、入力方位角に強く反応する
ニューロンはＣ２である。

【００６１】（ｑ_1,ｑ_2,ｑ_3,ｑ₄）＝（0.14115, 0.620
338, 0.231205, 0.0073078) 図８は図５よりニューロンの数を増やし、０〜２πの方
位角のレンジを１２個のニューロンで分割した場合の出
力強度である。１個あたりのニューロンの受容野は小さ
くなり、それぞれのニューロンの出力関数は次式のよう
になる。

【００６２】

【数１１】

【００６３】図９は、図８のように１２個のニューロン
を用いた場合に、方位角としてのθ＝４π／５の入力に
対する出力強度比率を示す。各ニューロンの出力強度比
率は次のようになる。入力方位角に強く反応するニュー
ロンはネットワーク全体の中の小さな領域に限定される
ことになり、入力方位角の情報は空間的に局在化した形
で表現される。

【００６４】（q_1,q_2,q_3,q_4,q_5,q_6,q_7,q_8,q_9,
q_10,q_11,q₁₂)＝（0.0000，0.0000,0.0000, 0.0446, 0.7
333, 0.2209, 0.0012, 0.0000, 0.0000, 0.0000, 0.000
0,0.0000) 次に回帰情報処理部の構成について説明する。図１０は
回帰情報処理部１２のニューラルネットによる実現方式
を示す。このニューラルネットは、先願としての文献２
におけるベクトル演算装置と同様の動作を行うものであ
るが、その動作について簡単に説明する。まず運動状態
センサから入力される方位角変化量Δφ ⁽ⁿ⁾は、信号の
離散・局在化を行うガウスフィルタとしてのニューラル
ネット２１によって前述のように信号の局在化が行われ
た後に、コサイン行列による信号変換部２２に与えられ
る。

【００６５】この信号変換部２２は出力層ニューロン２
５に対応する入力荷重を与えるものであり、ガウスフィ
ルタとしてのニューラルネット２１のニューロンを入力
層として動作するニューラルネットの入力荷重を表す。

【００６６】入力層を構成するニューロン、ここではガ
ウスフィルタとしてのニューラルネット２１のニューロ
ンをＭ個とし、出力層２５のニューロンをＮ個とする。
一般にＭはＮに比べて充分に大きいものとする。入力層
２１のニューロンはガウス型の受容野を持ち、その受容
野の広さは充分に狭いものとする。出力層２５の素子は
入力の荷重和を線形的に出力するものとする。

【００６７】コサイン行列による信号変換部２２は方位
角の空間的な符号化を行うものであり、回帰ベクトルの
計算では方位角をコサイン関数を用いた表現に変換する
必要がある。入力層のニューロン２１のインデックスを
ｊ＝１，２，・・・，Ｍ、出力層２５のニューロンのイ
ンデックスをｉ＝１，２，・・・，Ｎとする。入力層ニ
ューロンから出力層ニューロンへの結合荷重、すなわち
変換部２２におけるコサイン行列を構成する結合荷重Ｓ
_ijを次式によって設定する。

【００６８】

【数１２】

【００６９】入力層ニューロンの出力をＹ_i，これに対
応する出力層ニューロンの出力をｈ _iとする。前述のよ
うに入力層２１のニューロンの中には、方位角変化量Δ
φ⁽ⁿ ⁾に対して強く反応するニューロンｋが存在し、そ
の出力は“１”となるのに対して、その他の素子は反応
せず、出力は“０”となる。強く反応するニューロンが
１個だけであるとすれば、Δφ ⁽ⁿ⁾〜（２π／Ｍ）ｋと
なることを意味し、方位角の変化量の信号は結局、出力
層のｉ番目のニューロンに対して、次式で示される分だ
け作用することになる。

【００７０】

【数１３】

【００７１】従って方位角に関する入力信号の出力層ユ
ニットの出力への影響は、次式によって与えられること
になる。

【００７２】

【数１４】

【００７３】この出力の影響分に対して、移動距離に対
する変換部２３によって、移動距離に関する入力信号Δ
ｕ⁽ⁿ⁾に応じてシナップス結合による情報の修飾と呼ば
れる動作が行われ、この影響分は次式で示すように変換
される。

【００７４】

【数１５】

【００７５】これによって微小時間における回帰ベクト
ルの変化が(30)式で示すように符号化され、出力層ニュ
ーロンにおいて２５加算されることになる。次のコサイ
ン行列による信号安定化部２４の動作を説明する。この
信号安定化部は、時刻ｎの回帰ベクトルに微小時間にお
ける回帰ベクトルの変化量を加算して、時刻ｎ＋１にお
ける回帰ベクトルを求めるものである。出力層２５の各
素子の時刻ｎ＋１における出力の値は、次式によって与
えられることになる。

【００７６】

【数１６】

【００７７】この計算を実行するためには時刻ｎにおけ
る回帰ベクトルを一時的に保存するための短期記憶を必
要とする。この短期記憶は再帰結合の荷重、すなわちコ
サイン行列による信号安定化部２４の内部に黒丸で示さ
れた結合の荷重Ｔ_ikによって実現される。

【００７８】この荷重Ｔ_ikは次式が成立するように設定
される。

【００７９】

【数１７】

【００８０】自明な結合荷重としてクロネッカーのデル
タδ_ikがある。これを用いると次式によりＴ_ikが与えら
れる。Ｔ_ik＝１（ｉ＝ｋ），Ｔ_ik＝０（ｉ≠ｋ） (33) この自明な結合荷重以外の結合荷重として次式で与えら
れる結合荷重が存在する。

【００８１】

【数１８】

【００８２】この結合荷重によって短期記憶が実現され
ることと、同時に出力層においてバイアスｂが存在する
場合にも、そのバイアスが除かれて時刻ｎにおける回帰
ベクトルの値が正しく取り出せることを以下に示す。す
なわち次式が成立することを証明する。

【００８３】

【数１９】

【００８４】(35)式を証明するために、はじめに

【００８５】

【数２０】

【００８６】を示す。

【００８７】

【数２１】

【００８８】という関係がある。ｊは虚数単位である。

【００８９】

【数２２】

【００９０】

【数２３】

【００９１】この変形過程で第２行は第１行のｅ^jxにｅ
^jx(N-1)/2を、その後の分数式の分母に−ｅ^-jx/2を、
また分子に−ｅ^{-jx N/2}を乗ずることによって得られ
る。式〔３〕と式〔４〕の実部と虚部をそれぞれ比べる
と、式〔１〕と式〔２〕が成り立つことが判る。

【００９２】次に式〔１〕と式〔２〕にｘ＝２π／Ｎを
代入すると、

【００９３】

【数２４】

【００９４】が成り立つことが判る。また、ｘ＝４π／
Ｎを代入しても同様に

【００９５】

【数２５】

【００９６】が得られる。次に任意の位相シフトφにつ
いて

【００９７】

【数２６】

【００９８】を示す。Σ^N _k=1cos((2π／Ｎ）ｋ＋φ）
を加法定理を使って、

【００９９】

【数２７】

【０１００】と変形し、式〔５〕と式〔６〕を代入する
と、式

〔９〕になる。同様に加法定理を使って

【０１０１】

【数２８】

【０１０２】を計算し、式〔５〕と式〔６〕を代入する
と、式〔10〕を導くことができる。同様の議論で

【０１０３】

【数２９】

【０１０４】を導くことができる。ここで式

〔９〕と式
〔10〕は任意のφで成立するので、φ＝−（２π／Ｎ）
ｉにおいても成立する。従って、

【０１０５】

【数３０】

【０１０６】また式〔13〕と式〔14〕は任意のφで成立
するので、φ＝−（４π／Ｎ）ｉにおいても成立する。

【０１０７】

【数３１】

【０１０８】以上のことを踏まえて、

【０１０９】

【数３２】

【０１１０】が得られる。式〔15〕を代入すると右辺の
第２項（ｂがかかっている項）が消えて

【０１１１】

【数３３】

【０１１２】となる。これを

【０１１３】

【数３４】

【０１１４】と変形し、加法定理を適用することで、

【０１１５】

【数３５】

【０１１６】を得る。ここで

【０１１７】

【数３６】

【０１１８】という関係式を使ってさらに変形する。

【０１１９】

【数３７】

【０１２０】ここで、式〔17〕と式〔18〕を代入する
と、

【０１２１】

【数３８】

【０１２２】となり、(35)式が成立することが証明され
た。以上のように、(34)式で与えられる再帰結合の荷重
を用いれば再帰結合が短期記憶として機能するだけでな
く、バイアスが除かれることが分かる。この結合荷重行
列の固有値を考えると、

【０１２３】

【数３９】

【０１２４】に対応する固有値の絶対値は“１”であ
り、その他の固有値の絶対値は“１”より小さくなる。
もし回帰ベクトル信号に周波数２π／Ｎとは異なる周波
数の成分が混入していても、その異なる成分にとっては
再帰結合による変換は縮小写像として作用するため、回
帰ベクトルを積算していく過程で繰り返される計算によ
ってその成分は消失する。これはノイズの蓄積が生じな
いことを意味する。

【０１２５】次に感覚情報処理部１４の動作について図
１１を用いて説明する。感覚情報処理部は、例えばロボ
ットの移動空間内の複数のランドマークとロボットとの
距離を示すセンサ信号の入力に応じて、センサ信号を感
覚信号に符号化する。

【０１２６】感覚情報処理部１４は、例えばニューラル
ネットワークによって構成され、その学習モードにおい
ては、入力層のニューロンに入力される感覚信号ベクト
ルと比較した場合に、各入力層ニューロンからの重みを
１つのベクトルと考えた重みベクトルとの差が最も小さ
い出力層ニューロンが勝者ニューロンとされ、その勝者
ニューロンに対して最も大きく重みの変更が行われる自
己組織化学習が実行される。本実施例では学習終了後の
この入力重みベクトル、すなわち出力層の各ニューロン
への重みベクトルを、感覚信号空間におけるプロトタイ
プと呼ぶことにする。

【０１２７】この自己組織化学習については、Kohonen
のフィーチャーマップアルゴリズムの他に、ニューラル
ガスアルゴリズムやグローイングセルストラクチャがあ
り、これらのアルゴリズムについては次の文献に記述さ
れている。

【０１２８】文献４：T.kohonen: The Self-Organizing
Map, Proc. IEEE, Vol.78, No.9,pp.1464 〜1480 (199
0) 文献５：T.M.Martinetz 他：“Neural-Gas”Network fo
r Vector Quantization and its Application to time-
Series Prediction, IEEE Trans. on Neural Networks,
Vol.4, No.4, pp.558〜569 (1993) 文献６：B.Fritzke, Growing Cell Structures-A Self-
Organizing Network for Unsupervised and Supervised
Learning, Neural Networks, Vol.7, No.9, pp.1441〜
1460 (1994) 図１１において、センサ信号の入力に対応て、ステップ
Ｓ１１で座標変換によるセンサ信号の局所線形化などが
行われた後に、ステップＳ１２でガウス関数などのラジ
アルベース関数を用いたセンサ信号の離散・局在化が行
われて、感覚信号が得られる。

【０１２９】ここでラジアルベース関数とは、関数の近
似や補間において基底として用いられるものであり、ガ
ウス関数以外に双曲線関数などがある。ラジアルベース
関数をｇ_i(x) とすると、任意の関数は次式のように表
される。

【０１３０】

【数４０】

【０１３１】一般にｔ∈［０，１］上に定義された任意
の実数値関数ｆ(t) を、ある連続関数の系列ｇ₁(t)，・
・・，ｇ_n(t) ，・・・の線型結合

【０１３２】

【数４１】

【０１３３】で書ける場合に、各ｇ_i(t) は任意の実数
値関数ｆ(t) の基底関数と呼ばれる。例えば１，ｘ，ｘ
²，・・・，ｘⁿ，・・・は任意の実数値関数を次の形
式で表現する。有限個の重ね合わせでも高精度の近似が
実現される。

【０１３４】

【数４２】

【０１３５】続いてステップＳ１３でセンサ信号から得
られたこの感覚信号と現在の各プロトタイプ候補、すな
わちニューラルネットワークにおける各出力層ニューロ
ンへの入力重みベクトルとの距離の比較が行われ、ステ
ップＳ１４で入力感覚信号ベクトルと最も近いプロトタ
イプ候補が決定され、学習信号が得られる。そしてこの
学習信号を用いて、自己組織化による学習として、ステ
ップＳ１５で更新ルールに従って各プロトタイプ候補の
更新が行われる。この学習信号と更新ルールについては
詳しく後述する。

【０１３６】そしてステップＳ１６で学習結果の評価の
ために学習スケジュールが評価され、例えば学習回数が
上限値を越えていない場合には、次のセンサ信号に対す
る学習を行うためにステップＳ１７で信号入力待ちとな
り、センサ信号の入力に応じてステップＳ１１からの処
理が繰り返される。ステップＳ１６の学習スケジュール
評価において学習回数が上限値を越えていれば、感覚情
報処理部１４の学習は終了し、その時点のプロトタイプ
候補が感覚信号に対するプロトタイプとされる。

【０１３７】まず図１１におけるセンサ信号のガウス関
数による離散・局在化（Ｓ１２）の処理について説明す
る。ここで次元拡大が行われるセンサ信号の次元は、セ
ンサの種類と個数、およびレンジで決まる。例えば移動
体に備えられるセンサとして超音波センサだけを用いる
ことにする。超音波センサは４個であり、それぞれ４つ
の方向について障害物や壁までの距離を計測するものと
する。この時センサ信号空間は４次元である。

【０１３８】各超音波センサは０から３ｍまでの計測範
囲、すなわちレンジを持つものとし、このレンジをフィ
ルタを用いて３つの部分レンジに分割することにすれ
ば、図１２に示すような符号化されたフィルタの出力信
号が得られる。このような符号化を行うことにより、１
つのセンサ信号を３次元のベクトルで表現できることに
なり、結果としてフィルタで次元拡大されたセンサ信号
空間は１２次元となる。図１２と異なって部分レンジが
重なりあうように分割してもよいことは当然である。

【０１３９】ロボットと障害物との距離に対応したセン
サ信号の次元拡大の具体例について、図１３〜図１７を
用いて更に詳しく説明する。図１３はロボットに備えら
れた４個の超音波センサＳ１〜Ｓ４が、それぞれ４個の
障害物までの距離を測定している状況を示す。楕円がロ
ボットであり、黒く塗り潰された四角形が障害物であ
る。センサＳ１は障害物が1.5 〜2.5 ｍのレンジに存在
することを、それぞれ以外のセンサは 2.5ｍを越えてい
ることを検出する。

【０１４０】図１４は図１３の４つのセンサ信号を、１
個のセンサあたり、ガウス型の受容野を持つ３個のニュ
ーロンでレジン分割し、センサ信号を次元拡大するニュ
ーラルネットの説明図である。同図においては、１個の
センサからの信号に対して、それぞれ荷重として 0.5,
1.5 および2.5 ｍを用いた３つのニューロンで３つの部
分レンジに分解し、各ニューロンの出力強度でセンサと
障害物との距離を離散・局在化させて表現するものとす
る。各ニューロンの出力関数は図６で説明したものと同
様とし、分散の値としては 0.5ｍを用いる。

【０１４１】図１５は図１４のニューラルネットによる
各ニューロンの出力強度を示す。各ニューロンの出力強
度は、荷重を中心とするガウス型の関数となっている。
図中に各センサＳ１〜Ｓ４によって検出される障害物の
距離が示されている。

【０１４２】図１６は図１４のニューラルネットの出力
パターンを示す。ｘ１〜ｘ１２の各ニューロンは、図１
５における各センサで検出される障害物の位置に応じた
出力を与えることになる。このようにセンサ１個あたり
のニューロンの数を増やし、受容野の分散を小さくする
と、出力の大きいニューロンはニューラルネット全体の
中でごく小さな部分に過ぎなくなることが分かる。この
ような活発な領域は、センサと障害物との距離に応じて
移動する。多次元の信号に変換された信号の各要素の大
部分は０に近い値となり、情報を直接担うニューロンは
ごく一部のものとなる。

【０１４３】図１７は各センサとそれに対応する障害物
との距離、および各ニューロンの出力強度をまとめたも
のである。次に感覚情報処理部１４における学習アルゴ
リズムについてさらに説明する。図１８は感覚情報処理
部のニューラルネットによる実現の説明図である。この
ニューラルネットは１２個の入力層ニューロン、すなわ
ち入力素子と、９個の出力層ニューロン、すなわち出力
素子から構成され、各出力素子に対して、入力素子から
与えられる信号に対する荷重は可変であり、自己組織化
学習ルールによってこの荷重の更新が行われる。

【０１４４】入力素子に与えられる感覚信号、すなわち
ガウスフィルタによって次元拡大されたセンサ信号は、
例えば図１４のニューラルネットによって与えられるも
のであり、これに対して入力素子の数は１２個となって
いる。一方、出力素子の数は感覚信号空間におけるプロ
トタイプの数に対応し、ここでは９個となっている。

【０１４５】図１８のニューラルネットにおいて、感覚
信号ベクトルの入力に対して、このベクトルと各出力素
子の入力荷重ベクトルとの距離に応じた値を用いて、自
己組織化学習ルールによって荷重が更新される学習処理
が行われる。この学習処理においては、感覚信号空間Ｘ
を示す曲面が自己組織化アルゴリズムによって量子化さ
れる。

【０１４６】この量子化は、例えばフィーチャーマップ
アルゴリズムによって、量子化される。この量子化は、
例えばフィーチャーマップアルゴリズムによって、感覚
信号空間内の曲面Ｍに前述のプロトタイプとての格子を
各格子間が等距離になるように埋め込むものである。信
号空間の曲面Ｍが全せい的（すなわち平面もしくは球面
の一部）でない場合には、フィーチャーマップアルゴリ
ズムによって歪みのないマップを作ることは困難であ
り、この場合にはニューラルガスアルゴリズムや、グロ
ーイングセルストラクチャを用いることにより、歪みの
ないマップを作ることができる。本実施例では、実装が
容易なニューラルガスアルゴリズムを用いて感覚信号の
プロトタイプを生成することにする。

【０１４７】移動体、すなわちロボットは移動空間上で
ランダムウォークを行うものとする。そのランダムウォ
ークは次式によって示される。ｈ^(t)＝ｕ^(t-1)cos(ωｋ＋φ^(t-1)) ＋Δu ^(t-1)cos(ωｋ＋Δφ^(t-1)) (36) ここでΔｕ^(t-1)は一定の微小量であり、Δφ^(t-1)は
０〜２πの範囲でランダムに選ばれるものとする。ωｋ
は符号化に用いられる定数である。

【０１４８】移動体のセンサから得られる信号は↓ｓ
（ｈ^(t)) とする（なお、本文中、ベクトル記号には下
矢「↓」を付記して表現する）。このセンサ信号は前述
のように次元拡大されて、多次元の感覚信号空間Ｘ内の
曲面Ｍ上の信号↓ｘ（ｈ^(t))となる。この信号を簡単
のために↓ｘ^(t)と書くことにする。

【０１４９】図１８のニューラルネットの入力素子への
入力信号は感覚信号空間の全せい的な曲面Ｍ上の点↓ｘ
^(t)であり、出力素子からの出力は感覚信号空間に各格
子間が等距離に埋め込まれる格子、すなわちプロトタイ
プ｛↓ｗ₁，・・・，↓ｗ_M｝の各候補（学習によって
プロトタイプに収束する）と入力信号としての↓ｘ^(t ⁾
との距離に応じた値である。

【０１５０】入力信号↓ｘ^(t)に対する各出力素子の出
力ｙ_i ^(t)（ｉ＝１，２，・・・，Ｍ）は次式によって
与えられるものとする。

【０１５１】

【数４３】

【０１５２】各出力素子の入力荷重の更新における全順
序ｋ_iは各素子の出力の大きな順、すなわち次の不等式
の順に決定される。

【０１５３】

【数４４】

【０１５４】この全順序についてはさらに後述する。学
習の回数の上限はｔ_max、学習のスケジュール関数η
（ｔ）とλ（ｔ）は共に単調減小関数とし、スケジュー
ルに関する定数については次の関係があるものとする。

【０１５５】η₁＞η₂＞０， λ₁＞λ₂＞０また各出力素子の受容野の広さσ_iは正とし、規格化定
数ξ_iも正とする。図１８のニューラルネットによるプ
ロトタイプ生成の手順は、次の(1) 〜(6)によって行わ
れる。 (1) ネットワークの初期化、各（出力）素子は識別子ｉ
＝１，２，・・・，Ｍにより区別される。ランダムな微
小値を選択することで各素子の入力荷重ベクトルである
↓ｗ_i ⁽⁰⁾，｛ｉ＝１，２，・・・，Ｍ）を初期化す
る。 (2) ｔ←１として学習を開始する。 (3) 感覚信号↓ｘ^(t)を読み込む。 (4) 感覚信号↓ｘ^(t)と各入力荷重から各素子の出力を
計算してそれに基づく各素子間の全順序ｋ_iを計算す
る。 (5) 全順序に基づいて入力荷重を修正する。

【０１５６】

【数４５】

【０１５７】(6) ｔ←ｔ＋１，ｔ＞ｔ_maxであれば学習
を終了する。さもなければ(3) に戻る。このプロトタイ
プ形成のアルゴリズムによって、入力ベクトル↓ｘ^(t)
が感覚信号空間の曲面上の一様な分布に従って生成され
るならば、曲面全体を一様に被覆するプロトタイプ｛↓
ｗ₁，・・・，↓ｗ_M｝が得られる。感覚信号曲面が全
せい的であれば、このプロトタイプはこの曲面を一様に
量子化するものとなり、ロボットの移動空間に一様に分
布する代表点と１対１に対応するものとなる。

【０１５８】図１９は感覚信号空間内の曲面上を一様に
被覆するプロトタイプ形成過程の説明図である。同図に
おいては、３つの座標軸によって感覚信号空間全体が３
次元以上の高次元空間であることが表されている。図中
の大きな長方形がセンサ信号を次元拡大した結果として
の感覚信号の曲面であり、白い円はニューラルネットの
各出力素子の荷重を表すものとする。図１８の９個の出
力素子の入力荷重を表す白い円が感覚信号曲面の全体を
一様に被覆する９個のプロトタイプとなる過程を説明す
る。小さな長方形は最終的には得られるプロトタイプの
近傍である。

【０１５９】まず最初にランダムな値によって入力荷重
が初期化される。この初期荷重の曲面上における位置を
(1) に示す。前述のようにロボットはランダムウォーク
を行いながら、移動空間全体を移動し、センサ信号を出
力する。このセンサ信号は、次元が拡大された後に感覚
信号としてニューラルネットに入力される。

【０１６０】図１９(2) において、入力された感覚信号
は黒で塗りつぶされた四角で表される。この入力感覚信
号に対して各荷重との間の距離が計算される。但しこの
計算においては感覚信号空間上に定義されている距離が
用いられる。そして計算された距離に基づいて各荷重に
対する修正における全順序が決定され、その順序に基づ
いて荷重の修正が行われる。

【０１６１】この時最も順位の高い荷重が入力された感
覚信号に最も近づくように修正が行われる。すなわち距
離の近い荷重ほど荷重の修正量が大きくなる。残りの荷
重に対しても順位に応じて入力された感覚信号の方向へ
の修正が行われる。この修正量は順位が下がるに従って
指数関数的に減少するように設定される。(3) はこのよ
うな修正によって新しく得られた荷重の分布を示す。

【０１６２】(4) において新しい感覚信号が入力され、
これに対応して荷重修正における全順序が計算され、順
位に応じて荷重の修正が行われ、その結果として(5) に
示す荷重の分布が得られる。以下同様に(6) において新
しい感覚信号の入力が行われ、荷重の修正処理が行われ
る。このような入力荷重の修正量は時間と共に単調に減
少するように処理が行われ、最終的に（Ｎ）に示すよう
に各荷重は感覚信号曲面全体を一様に被覆するプロトタ
イプに収束する。

【０１６３】図２０は荷重修正時における全順序の使用
の効果の説明図である。この全順序に基づいて荷重の修
正を行うことによって、空間に特異点があるような場合
においても、信号曲面全体を一様に被覆するように格子
点、すなわちプロトタイプをうまく埋め込むことができ
るようになる。

【０１６４】通常のユークリッド距離や内積による距離
を用いる場合には、対象となる空間に対して厳しい条件
が課せられる。例えば特異点が存在しないことや、全体
が連結の領域であること、空間の曲率が一定であること
などが要求される。従って不連結領域や特異点が存在す
るような空間で、ユークリッド距離に基づいて自己組織
的なプロトタイプ生成アルゴリズムを実行してもうまく
いかないことになる。

【０１６５】図２０(a) は対象となる信号曲面を示し、
この信号曲面は捻じれていて、アルファベットのＣのよ
うな形状になっている。信号曲面上の点ｐは、２つの点
ａとｂに対してユークリッド距離をとる場合には等距離
にあるものとする。しかしながら点ｐとｂとの間には信
号曲面に含まれない領域が存在する。

【０１６６】従ってフィーチャーマップアルゴリズムを
適用する場合には、点ａの近傍と点ｂの近傍を点ｐに対
して同様に取り扱うことはできない。なぜならフィーチ
ャーマップアルゴリズムでは、被覆すべき信号曲面の任
意の点の近傍は、ユークリッド距離に基づいて連続であ
ることが要求されるからである。点ｐに対する点ｂの距
離は、フィーチャーマップアルゴリズムでは、図に示す
ように信号曲面の穴に沿った遠回りの経路で測定される
ことになる。

【０１６７】図２０(b) はフィーチャーマップアルゴリ
ズムを用いた場合のプロトタイプによる信号曲面の被覆
結果である。図中の黒く塗りつぶした小さな円がプロト
タイプを表し、プロトタイプの間の隣接関係はプロトタ
イプを結ぶ格子として表されている。信号曲面全体をプ
ロトタイプでうまく一様に被覆することができないこと
が明らかであり、このような結果は実験によって確認す
ることができる。

【０１６８】(c) はニューラルガスアルゴリズムによる
被覆結果を示す。このアルゴリズムでは全順序に基づい
て重みの修正が行われるが、この修正における距離は点
と点との隣接関係で定義されているため、点と点との間
がどのような状態であってもユニークに距離が決定され
る。従って信号曲面の形状に左右されることなく、プロ
トタイプは信号曲面全体を一様に被覆するものとなる。

【０１６９】このように、ニューラルガスアルゴリズム
によれば、プロトタイプの形成の様子は、信号曲面の連
続性および連結性などに依存しないことが実験によって
も確認される。ニューラルガスアルゴリズムでは、プロ
トタイプの生成と隣接関係の埋め込みは分割して行われ
るため、マップに歪みが生じることはない。本実施例に
おけるプロトタイピングにおいて望ましい性質は、信号
曲面の均一な被覆と隣接関係の保存であり、このような
性質を不連結領域や特異点のある空間においても保証す
る方法として最も簡単なものが全順序に基づく入力荷重
の修正である。

【０１７０】図２１は感覚情報処理部１４の実行モード
における処理の説明図、図２２は感覚情報処理部１４の
ニューラルネットよる実現方式の説明図である。学習が
終了した感覚情報処理部１４は、実行モードにおいて、
ロボットが自分で動くのではなく、例えば自動車などに
積まれて移動空間内の未知の任意の点に下ろされた時、
その点におけるセンサ信号を基にしてその地点に対応す
るユニークな感覚情報を出力し、それを情報統合部１６
に与えることによって、情報統合部１６がそのユニーク
な感覚信号の値に対応する移動空間上の点の位置を、回
帰情報として出力することを可能にさせたものである。

【０１７１】図２１において、ステップＳ１１およびＳ
１２の処理は図１１におけると同様であり、任意の点に
対応するセンサ信号は感覚信号空間の信号曲面上の点に
対応する感覚信号に変換される。

【０１７２】そして図２２に示されるようにその感覚信
号、すなわちガウスフィルタによって次元拡大されたセ
ンサ信号はニューラルネットの入力素子に与えられ、図
２１のステップＳ１８にあるようにプロトタイプとの照
合が行われ、各プロトタイプ、図２２では９つのプロト
タイプとセンサ信号との間の距離の評価が行われ、ステ
ップＳ１９でその距離に応じた符号化として荷重に基づ
いたベクトル符号化が行われ、感覚情報、すなわちプロ
トタイプと入力信号との距離に応じた値として、情報統
合部１６に出力される。

【０１７３】図２２において、９つのプロトタイプに対
応する出力素子に対する入力荷重、すなわち結合荷重行
列の各行は感覚信号空間のプロトタイプに対応し、各出
力素子は感覚信号空間のプロトタイプと入力信号との距
離に応じた値を計算することになる。

【０１７４】次に情報統合部１６の動作について説明す
る。図２３は情報統合部１６の学習モードにおける処理
の説明図、図２４は学習モードにおけるニューラルネッ
トによる実現方式の説明図である。情報統合部１６は時
間的な相関に基づいて感覚情報と回帰情報とを統合する
ものである。感覚情報処理部１４におけるプロトタイプ
の集合は、移動空間を分割する代表点の集合と一対一に
対応する。しかしながら感覚信号単独では、プロトタイ
プとの間の距離情報と移動空間内における代表点の間の
距離との関係を確定することができない。その理想は移
動距離や方向の情報があって初めて感覚信号の変化量を
計算可能になるからである。

【０１７５】感覚信号の微小変化がロボットの運動の微
小変化と対応づけられることにより、移動空間の連続性
が再現される。これによって空間の位置情報を表現する
ことが可能となり、回帰情報と感覚情報を統合すること
によって、初めてロボットは移動空間の座標系を自律的
に獲得することが可能となり、その作業から設計者を除
くことができる。空間の座標系を生成するにあたって
は、情報統合部１６が同時に受け取った異なるセンサの
信号の間には強い関連性があるという条件付け原理、こ
こではこれを同時性原理と呼ぶことにする、を用いる。
この原理に基づいて情報統合が行われるが、移動空間の
座標系を獲得する方法としてはプロトタイプを用いた補
間計算が採用される。

【０１７６】図２３において情報統合部１６は、回帰情
報処理部１２から回帰情報、感覚情報処理部１４から感
覚情報をステップＳ２１で入力として受け取る。これら
の情報は同時刻に抽出されたものである。回帰情報処理
部１２からの回帰ベクトル信号（回帰情報）は、図２４
において無条件刺激として４つの入力素子に与えられ
る。この入力信号と出力素子との間の入力荷重は固定さ
れている。また感覚情報処理部１４からの符号化された
感覚信号としてのプロトタイプ（と感覚信号との距離に
応じた）信号は、条件刺激として９つの入力素子に与え
られる。これらの入力素子の数は、回帰情報処理部１２
および感覚情報処理部１４の出力素子の数にそれぞれ対
応する。感覚情報処理部１４からの信号が入力される９
つの入力素子と出力素子との間の入力荷重は可変とさ
れ、この荷重は学習によって更新される。各出力素子は
線形出力特性を持つものとする。

【０１７７】ここで無条件刺激、条件刺激という用語
は、１９６０年代にGrossberg が学習によって特定の刺
激に対して一定の反応をする生物の行動をニューラルネ
ットを使ったモデルによって構成した時に使用した用語
であり、心理学や生理学においては普通に用いられてい
るものである。

【０１７８】条件付け学習モデルにおいては、無条件刺
激は定常的にニューラルネットに入力されている信号で
あり、無条件刺激だけではニューラルネットの学習は行
われない。条件刺激が入力されて初めてネットワークが
活性化し、ニューラルネットの学習が行われる。条件刺
激の大きさによってニューラルネットの活性状態が様々
に決まり、その時の状態にあわせて無条件刺激がニュー
ラルネットの荷重として学習される。

【０１７９】図２３のステップＳ２２で条件刺激の強度
に応じて強化荷重が決定される。後述するように本実施
例では条件刺激、すなわちプロトタイプ信号のうちで最
大の値を持つ信号が入力される入力素子に対応する結合
荷重、すなわち結合荷重列が強化荷重として決定され、
ステップＳ２３でその強化荷重に対応する学習信号が無
条件刺激、すなわち回帰ベクトル信号に応じて生成さ
れ、Grossberg 型の学習における学習信号として用いら
れる。この学習については更に後述する。

【０１８０】そしてステップＳ２４で、回帰ベクトルの
プロトタイプ（に相当する）行列の列毎の修正として、
感覚情報処理部１４からの信号が入力される入力素子に
対応する結合荷重が列を単位として修正され、その結合
荷重列が感覚信号のプロトタイプに対応した回帰ベクト
ルを表現するように結合荷重の更新が行われ、感覚信号
プロトタイプに対応した回帰ベクトルの情報が、荷重と
してネットワークに埋め込まれることになる。

【０１８１】その後ステップＳ２５で学習結果の評価と
して、例えば学習スケジュールが評価され、学習回数が
上限値を越えている場合には学習が停止され、越えてい
ない場合にはステップＳ２６で次の信号の入力待ちとな
り、ステップＳ２１以降の処理が繰り返される。

【０１８２】図２５は、情報統合部の学習によってニュ
ーラルネットに埋め込まれる感覚信号プロトタイプと、
回帰ベクトルの対応関係の説明図である。図１９で説明
したように、学習が終了した時点で感覚情報処理部１４
のニューラルネットには感覚信号曲面プロトタイプに対
応する荷重が埋め込まれ、感覚情報処理部１４はプロト
タイプと入力信号との距離に応じた値を出力することに
なる。この感覚信号プロトタイプとロボットの移動空間
内の点はユニークに対応し、対応する点の回帰ベクトル
の原点が決まればその座標はユニークに決定される。

【０１８３】ロボットによって自律的に獲得されるプロ
トタイプがどの回帰ベクトルに対応するかは、情報統合
部１６の学習が行われるまでは不明である。しかしなが
らロボットが空間を探索している間に感覚信号プロトタ
イプを条件刺激、回帰ベクトルを無条件刺激としてGros
sberg 型の学習を行えば、図２５に示される対応付けの
関係が自律的にニューラルネットの内部に埋めこまれる
ことになる。

【０１８４】情報統合部１６における条件学習アルゴリ
ズムについて更に説明する。情報統合部１６におけるニ
ューラルネットは、符号化された回帰ベクトルの次元と
等しい数の出力素子を持つ。このニューラルネットに入
力される条件刺激としての符号化された感覚信号↓ｙ
^(t)、および無条件刺激としての回帰ベクトル↓ｈ^(t)
はそれぞれ次式によって与えられるものとする。

【０１８５】

【数４６】

【０１８６】学習のスケジューリング関数は単調増加関
数であり、次式で与えられる。

【０１８７】

【数４７】

【０１８８】このスケジューリング関数に対する閾値Ｄ
は正であり、学習回数の上限はｔ_ma _xであり、学習定数
ａは次の範囲を持つ、なおμ(t) は学習開始を制御する
ものであり、その値がＤを越えたときに学習が開始され
る。

【０１８９】０＜ａ≪１ニューラルネットの出力は、感覚信号のプロトタイプに
ユニークに対応する回帰ベクトルのプロトタイプ｛↓ｖ
₁，・・・↓ｖ_M｝となる。情報統合部１６における条
件学習は、次の(1) 〜(7) の手順によって行われる。 (1) ネットワークの初期化、各（出力）素子は識別子ｉ
＝１，２，・・・，Ｎにより区別される。ランダムな微
小値を選択することで各素子の条件入力荷重ベクトル↓
ｕ_i ⁽⁰⁾，（ｉ＝１，２，・・・，Ｎ）を初期化する。 (2) ｔ←１として学習を開始する。 (3) μ(t) ＞Ｄであれば(4) を実行、さもなければ(7)
にジャンプする。 (4) 条件刺激↓ｙ^(t)と無条件刺激↓ｈ^(t)を読み込
む。 (5) 条件刺激の最大要素ｙ_jmax ^(t)のインデックスｊ
_maxを検出する。 (6) Grossberg の学習ルール：

【０１９０】

【数４８】

【０１９１】を適用して、各素子ｉ（ｉ＝１，２，・・
・，Ｎ）の入力荷重のｊ_max成分を更新する。ｕ_il（ｌ
≠ｊ_max）成分は更新しない。 (7) ｔ←ｔ＋１．ｔ＞ｔ_maxであれば終了。さもなけれ
ば(3) に戻る。

【０１９２】次に情報統合部１６の実行モードの動作に
ついて説明する。学習が終了した情報統合部１６は、実
行モードにおいて、センサ信号に対応して感覚情報処理
部１４から出力される感覚情報に基づいて、その感覚情
報に対応する感覚信号空間の曲面上の点とロボットの移
動空間上における点との対応関係によって、任意の点の
回帰ベクトルを出力する。この回帰情報の出力に際して
は、補間を用いて処理を実行する。

【０１９３】この補間においては、本実施例ではプロト
タイプに基づく凸包を用いることにし、ラジアルベース
関数による近似を行う。このラジアルベース関数による
近似については次の文献がある。文献７：M.T.Musavi他：On the Training of Radial Ba
sis Function Classifiers, Neural Networks, Vol.4,
pp.593〜603(1992) この凸包を用いた処理においては、感覚情報処理部１４
における各プロトタイプに対応する出力素子にガウス型
の受容野を設定し、感覚信号↓ｘとプロトタイプとの距
離に応じた重みの計算を次式によって行う。

【０１９４】

【数４９】

【０１９５】情報統合部１６では、感覚信号の各プロト
タイプに対応する回帰ベクトルがニューラルネットの荷
重として保存されているので、上式の重みに従って次の
凸包を求めることにより、入力信号に対応した回帰情報
の近似を行う。

【０１９６】

【数５０】

【０１９７】これらの式により、信号空間において滑ら
かな近似を実現することができる。ここで下の式のＶ
（ｉ₀）は感覚信号の最近接プロトタイプ↓ｗ_i0の近傍
を示す。すなわち近傍情報を用いた近似により、補間計
算の高速化が図られる。

【０１９８】図２６は情報統合部１６の実行モードにお
ける処理の説明図である。同図において、感覚情報の入
力に対応してステップＳ３０で回帰ベクトルのプロトタ
イプ行列の各列毎の重みとしてその感覚情報を受け取
り、ステップＳ３１で回帰ベクトルのプロトタイプの呼
び出しとして回帰ベクトルのプロトタイプが想起され、
ステップＳ３２で回帰ベクトルの補間として凸包が計算
され、回帰情報が出力される。これらの一連の処理はニ
ューラルネットによって一度に実行される。

【０１９９】図２７は情報統合部１６のニューラルネッ
トによる実現方式の実行モードの説明図である。実行モ
ードにおいては、感覚情報処理部１４から符号化された
感覚信号、すなわちプロトタイプ信号が入力され、ニュ
ーラルネットでは学習の結果固定された入力荷重を用い
て、出力素子がこの感覚信号に対応する回帰ベクトルを
想起し、その結果をロボットの駆動制御装置に与える。

【０２００】以上をまとめると、情報統合部１６は、量
子化された感覚信号空間において分割された各領域の代
表点に対応する移動空間内の代表点に対する回帰情報、
すなわち回帰ベクトルを基底として、移動空間内の任意
の位置における感覚情報、すなわち移動体を取り巻く環
境の観測結果に基づいて求められる感覚信号と前述の分
割された各領域の代表点との間の距離に対応する値を、
基底に対する重みとして用いて、任意の位置に対する回
帰ベクトルを補間によって求めることになる。

【０２０１】このように情報統合部１６によって、感覚
情報処理部１４から出力される符号化された感覚信号、
すなわちプロトタイプ信号（センサリープロトタイプ、
ＳＰ）から回帰ベクトル（ホーミングベクトル、ＨＶ）
が想起されるが、この想起された回帰ベクトルはロボッ
トの駆動制御装置１５に与えられ、ロボットによる座標
系の形成と自己の位置決めを可能とする。そこで回帰ベ
クトルを用いて、ロボットが任意の地点から原点まで回
帰する場合の、回帰経路の生成について説明する。

【０２０２】図２８(a) は情報統合部１６が回帰ベクト
ルの想起を繰り返し、ロボットは少しづつ原点に近づく
場合の説明図である。ロボットは環境を探索し、任意の
地点から原点まで回帰するために必要な制御情報を逐次
生成して、原点に近づいていく。この回帰行動における
回帰ベクトルの想起の繰り返し回数をｔとすると、回帰
行動は次の(1) 〜(5) の手順を用いて実行される。 (1) 情報統合部においてＳＰ→ＨＶ想起による現地点の
回帰ベクトル↓ｈ^(t)が想起される。 (2) 想起された回帰ベクトルの最大値要素ｈ_imax ^(t)を
担う素子ｉ_maxを検出する。 (3) ｈ_imax ^(t)がある小さな値以下であれば停止する。
さもなければ(4) を実行する。 (4) 移動体をφ^(t)＝（２π／Ｎ）ｉ_max方向にｕ^(t)
＝ｃ(t) ‖↓ｈ^(t)‖だけ移動する。ここで０＜ｃ(t)
＜１はｔの単調減少函数である。 (5) ｔ←ｔ＋１として(1) に戻る。

【０２０３】このようにして生成された制御情報、すな
わち距離を示すｕ^(t)、および方位φ^(t)に従って、ロ
ボットは回帰ベクトルを逐次想起しながら、原点との距
離を詰めていくことになる。

【０２０４】これに対して図２８(b) は、任意の地点に
おいて原点までの回帰のために必要な制御情報を一括し
て求める場合の説明図である。このように１回で原点ま
で回帰する場合の回帰行動は、次の手順(1) 〜(4) によ
って行われる。 (1) 任意地点における回帰ベクトル↓ｈをＳＰ→ＨＶ想
起により生成する。 (2) ↓ｈの最大要素を担う素子ｉ_maxを検出する。 (3) 回帰ベクトルから原点の方向

【０２０５】

【数５１】

【０２０６】と原点までの距離

【０２０７】

【数５２】

【０２０８】を計算する。 (4) 移動体はφ方向に距離ｕだけ移動して停止する。ここで(3) における原点の方向としての角度φの計算法
について説明する。回帰ベクトル（ｈ₁，・・・，
ｈ_N）の各要素のうちで最大値を持つ要素のインデック
スをｉ_maxとする。この最大値要素ｈ_imaxと、最大値要
素に隣接した成分ｈ _imax+1を使って、原点の方向φを求
める。一般には最大値要素と隣接した要素を使うだけで
なく、異なる２つの成分を利用することによりφを求め
ることができるが、計算式が面倒になる。

【０２０９】最大要素とそれに隣接した要素は

【０２１０】

【数５３】

【０２１１】と書ける。更にｈ_imax+1を加法定理によっ
て展開した形式で書くと、

【０２１２】

【数５４】

【０２１３】となる。この式の両辺を最大要素で割ると

【０２１４】

【数５５】

【０２１５】が得られる。この式をφについて整理する
と、

【０２１６】

【数５６】

【０２１７】となる。ただし、ｉ_max＝Ｎの場合にはｉ
_max＋１として“１”を用いるものとする。次に図２の
情報統合部１６による回帰情報をキーとする感覚信号の
想起について説明する。回帰ベクトル、すなわちＨＶか
ら感覚のプロトタイプ信号、すなわちＳＰを想起する機
能は、回帰ベクトルに基づいて獲得された座標系に基づ
いた高次の機能を実現する際に利用できる。例えばＨＶ
からＳＰを想起する機能によって、原点に対するロボッ
ト現在位置の相対位置から障害物の情報を想起して、あ
らかじめ障害物を避けるような運動制御の信号列を作り
出す時に利用される。

【０２１８】またＨＶからＳＰを想起する機能は、より
プリミティブなレベルとして、回帰ベクトルの計算にお
ける誤差蓄積の補正に使えると考えられる。例えば運動
情報を積算して得られている回ベクトル信号↓ｈ′(t)
から感覚信号のプロトタイプ↓ｓ′(t) を想起して、実
際に感覚センサ信号から計算されたプロトタイプ↓ｓ
(t) と比較し、両者の間の誤差が大きい場合には↓ｓ
(t) をキーとして想起される回帰ベクトル↓ｈ(t) を用
いて↓ｈ′(t) の置き換えを行うことによって、補正が
行われる。しかしながらこの方式では、想起する回帰ベ
クトルには誤差がないことが要求される。

【０２１９】情報統合部１６による、回帰ベクトルから
感覚のプロトタイプ信号を想起する動作について、図２
９〜図３２を用いて説明する。図２９はＨＶからＳＰを
想起する動作を実現するための学習モードにおける処理
の説明図、図３０は学習モードにおける情報統合部１６
のニューラルネットによる実現方式の説明図である。

【０２２０】図２９の学習モードにおいては、図３０の
ニューラルネットに回帰ベクトル信号とプロトタイプ信
号とが同時に入力され、回帰ベクトル信号をキーとし
て、出力層のニューロンがプロトタイプ信号と同じ出力
パターンを出力するように学習が行われる。この学習は
教師付学習のように見えるが、情報統合部１６のＨＶか
らＳＰを想起する部分に対する教師信号をシステムが作
り出しており、この教師信号に対応する感覚プロトタイ
プ信号を生成するニューラルネットワークが自己組織的
に構成されることを考えると、システム全体としては自
己組織型と考えられる。

【０２２１】図３０において、回帰ベクトル信号が入力
される部分におけるニューラルネットの荷重は可変であ
るが、感覚プロトタイプ信号が入力される部分の荷重は
固定である。

【０２２２】図２９において、まずステップＳ３４で回
帰ベクトル信号と感覚のプロトタイプ信号との入力が行
われ、ステップＳ３５で感覚のプロトタイプ信号の強度
パターンに応じて、ニューラルネット内の出力素子に対
する入力荷重の変更の度合いが決められる。基本的には
コホーネン型の学習ルールを適用して回帰ベクトル信号
空間のプロトタイピングが行われる。最も強く発火する
ニューロンを感覚のプロトタイプ信号で決定し、そのニ
ューロンに対応する入力荷重の更新が行われる。これに
よって感覚のプロトタイプ信号パターンとニューラルネ
ットの出力パターンを一致させることができる。

【０２２３】ステップＳ３６で回帰ベクトルと入力荷重
との差の評価が行われ、ステップＳ３７で学習信号、す
なわち入力荷重の更新量が生成され、ステップＳ３８で
その学習信号に基づいて入力荷重の更新が行われる。

【０２２４】回帰ベクトル信号はＮ次元の信号
ｈ₁ ^(t)，・・・，ｈ_N ^(t)であり、感覚プロトタイプ
信号はＭ次元の信号ｙ₁ ^(t)，・・・，ｙ_M ^(t)であ
る。出力素子はガウス型の受容野を持つニューロンであ
り、その素子数は感覚信号プロトタイプを生成するニュ
ーラルネットと同じである。学習回数ｔにおける出力層
のｉ番目のニューロンのｊ番目の入力荷重ｗ_ij ^(t)（ｉ
＝１，２，・・・，Ｍ、ｊ＝１，２，・・・，Ｎ）は、
次の学習ルールを用いて更新される。

【０２２５】

【数５７】

【０２２６】ステップＳ３９で学習スケジュールの評価
が行われ、適当な回数だけ学習が行われた後に学習は停
止される。その回数だけ未だ学習が行われていない場合
には、ステップＳ４０で信号入力待ちとなり、信号入力
に対応してステップＳ３４以降の処理が繰り返される。

【０２２７】図３０において斜線で塗られた円は入力層
ニューロンを表し、ここから回帰ベクトル信号と感覚の
プロトタイプ信号が入力される。白抜きの大きな円が感
覚のプロトタイプ信号を想起する出力素子を表し、その
個数は感覚のプロトタイプ信号の次元と同じである。灰
色の小さな円は回帰ベクトル信号に対する出力素子の入
力荷重を表し、その値は可変である。黒く塗りつぶされ
た小さな円は感覚のプロトタイプ信号に対する入力荷重
を表し、その値は固定である。

【０２２８】情報統合部１６における学習処理は、学習
回数の上限をｔ_max、学習のスケジュール関数を単調減
少関数μ(t) として行われる。スケジュールの定数の間
には次の関係がある。

【０２２９】μ₁＞μ₂＞０学習処理は次の手順(1) 〜(6) に従って行われる。 (1) ネットワークの初期化、各（出力）素子は識別子ｉ
＝１，２，・・・，Ｍにより区別される。ランダムな微
小値を選択することで各素子の入力荷重↓ｗ_i ⁽⁰ ⁾（ｉ
＝１，２，・・・，Ｍ）を初期化する。 (2) ｔ←１として学習を開始する。 (3) 回帰ベクトル信号↓ｈ^(t)と感覚のプロトタイプ信
号↓ｙ^(t)を読み込む。 (4) 感覚のプロトタイプ信号↓ｙ^(t)の各要素の強さに
応じて、回帰ベクトル↓ｈ^(t)と各入力荷重との差に基
づいて学習信号を生成する。

【０２３０】

【数５８】

【０２３１】(5) Δ↓ｗ_i ^(t)＝（Δｗ_i1 ^(t)，Δｗ_i2
^(t)，・・・，Δｗ_iN ^(t)），（ｉ＝１，２，・・・，
Ｍ）として各ニューロンの入力荷重↓ｗ_i ^(t)＝（ｗ_i1
^(t)，・・・，ｗ_iN ^(t)）の修正を行う。

【０２３２】↓ｗ_i ^(t+1)＝↓ｗ_i ^(t)＋Δ↓ｗ_i ^(t)
（ｉ＝１，２，・・・，Ｍ） (6) ｔ←ｔ＋１．ｔ＞ｔ_maxであれば学習を終了する。
さもなければ(3) に戻る。

【０２３３】図３１は情報統合部１６におけるＨＶから
ＳＰを想起する動作の実行モードにおける処理の説明
図、図３２はこの処理に用いられる情報統合部１６のニ
ューラルネットによる実現方式の説明図である。実行モ
ードでは、学習終了後にＨＶからＳＰを想起するため
に、感覚のプロトタイプ信号が入力される素子に対応す
る入力荷重が０とされ、学習で得られた回帰ベクトルが
入力される素子に対応する荷重が固定化された後に、図
３１の処理が行われる。すなわち回帰ベクトルが入力さ
れると、ステップＳ４２でその回帰ベクトルと、学習に
よって得られたプロトタイプ、すなわち入力荷重の値と
の距離が評価され、ステップＳ４３で距離の評価に基づ
いて感覚信号のプロトタイプが計算され、その結果が感
覚のプロトタイプ信号の想起結果として出力される。

【０２３４】図３２で出力層のニューロンの出力は、感
覚信号空間のプロトタイプに対応する回帰ベクトル信号
のプロトタイプを中心とするガウス型の受容野を持つ関
数である。具体的には、出力層のｉ番目のニューロンに
対する入力荷重を↓ｗ_i＝（ｗ_{i 1}，・・・ｗ_iN）と
し、回帰ベクトル信号を↓ｈ＝（ｈ₁，・・・，ｈ_N）
とすると、ニューロンの出力は次式によって与えられ
る。

【０２３５】

【数５９】

【０２３６】これによって、回帰ベクトル信号に対応し
た感覚信号のプロトタイプが出力層ニューロンから出力
されるようになる。ニューロンの出力の式における分散
σ_iの値は、感覚信号のプロトタイプを生成するニュー
ロン、すなわち図２２の出力素子に対応する分散の定数
倍（ｄ倍）とする。入力荷重の学習の後に感覚情報処理
部１４から出力される感覚のプロトタイプ信号と、図３
２において想起されるプロトタイプ信号との誤差が最小
になるようにｄの値が決められる。

【０２３７】以上をまとめると、量子化された感覚信号
空間において分割された各領域の代表点と、回帰情報空
間内の代表点に対応する移動空間内の代表点に対する感
覚信号との間の距離に応じた値としての感覚情報、すな
わち回帰情報空間内の代表点に対応する感覚情報を基底
として、移動空間内の任意の点に対する回帰情報を重み
として用いて、任意の点に対応する感覚情報、すなわち
プロトタイプ信号を補間によって求めることになる。

【０２３８】最後にロボットの回帰ナビゲーション（シ
ミュレーション）について説明する。この回帰ナビゲー
ションにおいては、ロボットは最初回帰行動の原点、す
なわち任意のホームポジションに設置された後、ロボッ
トは一定時間空間を探索し、回帰情報および感覚情報を
基に空間の様子を把握し、その後ロボットは任意の地点
に置かれ、原点に正確に回帰することができるかどうか
が調べられた。原点の場所や移動空間の領域の大きさは
ロボットに対しては与えられていない。

【０２３９】図３３はロボットと外界のセンサ信号との
関係の説明図である。ロボットは、例えば一辺がおよそ
２ｍの正方形に区切られた移動空間内を動くものとす
る。センサとして超音波センサなどを用いるものとすれ
ば、障害物からの距離に比例した信号がセンサ信号とし
て与えられる。このセンサ信号は移動空間の外側に配置
された手掛かり刺激と見なすことができる。簡単のた
め、センサ信号はロボットの車体の方向には依存しない
値として得られるものとする。例えば全ての方位に対し
てセンサを備える場合には、全ての方位のランドマーク
からの距離情報を利用できることと同じになる。

【０２４０】図３３において、ロボットは移動空間内に
おいてランダムウォークを行いながら運動情報を積算し
て回帰ベクトルを逐次計算し、かつ感覚信号を収集す
る。その間に感覚信号空間のプロトタイプを自己組織的
に形成し、移動空間に対応する感覚信号マップを獲得す
る。また同時性原理に従って、感覚情報と回帰情報とを
自己組織的な学習によって統合する。

【０２４１】図３４は学習終了後のロボットの位置決め
の説明図である。回帰情報と感覚情報とを統合すること
によって、すでに移動空間に対応する感覚信号空間上に
おいて回帰ベクトルを想起することが可能となってい
る。従って感覚信号をキーとして、任意の点におけるロ
ボットの位置情報である回帰ベクトルを求めることがで
き、複数個の回帰ベクトルを用いることにより、原点の
位置に対する空間点の相対位置を決めることができ、自
律的に移動空間内の座標系を獲得することができる。

【０２４２】本ナビゲーションにおいては、回帰情報処
理部としては図１０に説明したニューラルネットと同様
のものを用いることができるが、すでに出願人の先願
（文献２）においてベクトル演算装置としてその概要が
すでに与えられている。

【０２４３】回帰情報処理部１２は１つの運動経路に対
して運動信号を積算し、回帰情報を３１次元のコサイン
ベクトルとして情報統合部１６に提供する。感覚情報処
理部１４と情報統合部１６とは前述のようなニューラル
ネットワークによって構成される。感覚情報処理部１４
は２５個のニューロンを用いて感覚信号空間を分割する
プロトタイプを表現する。その出力はプロトタイプとセ
ンサ信号との距離の関数（ガウス関数）とする。

【０２４４】情報統合部１６は３１個のニューロンを用
いて学習によって回帰情報を表現する。各ニューロンの
入力荷重は回帰情報信号に対応するプロトタイプとして
機能する。空間探索においてランダムウォークによって
移動空間を移動し、移動空間全体を被覆するような経路
上でロボットは回帰情報および感覚情報を生成し、感覚
情報処理部１４および情報統合部１６においてオンライ
ン処理として逐次的に入力される信号に基づいて必要な
学習を行う。

【０２４５】回帰シミュレーションの結果を図３５〜図
３７を用いて説明する。このシミュレーション結果は、
回帰情報と感覚情報とを一対とした学習サンプル10,000
個を用いた場合の結果である。この学習は学習モードに
おいてオンライン処理によって行われた。オンライン処
理というのは機械学習理論の方面でよく使われる言葉で
ある。オンライン処理の学習では、１個のサンプルの入
力に対応して学習ルールを適用し、逐次的にネットワー
クの荷重を更新する形式で学習が行われる。オンライン
処理と異なる学習形式として、バッジ処理がある。バッ
ジ処理では、サンプルの集合全体に対して線形、もしく
は非線形最適化法が適用され、最適な仮説か一度に選択
されるような形式で学習が行われる。

【０２４６】感覚情報処理部１４におけるプロトタイプ
生成と、情報統合部１６における回帰情報と感覚情報の
統合において、それぞれの学習ルールが一対の入力に対
して１回適用される。

【０２４７】図３５は学習によって情報統合部１６にお
いて回帰情報と感覚情報が統合され、感覚信号空間のプ
ロトタイプに対応して形成された回帰ベクトル場を示
す。図において黒丸は格子点を、矢印は回ベクトルを示
す。

【０２４８】図３６は図３５に示したようなベクトル場
を基にして、任意の地点から原点に回帰した時の誤差を
示す。素子の数と学習回数が少ないためにある程度の誤
差が生じているが、ほぼ同程度の誤差で、滑らかに移動
空間としての座標系が再現されていることが分かる。

【０２４９】図３７は適当な任意の４地点Ｐ１〜Ｐ４を
選んで、具体的に想起された回帰情報と正確な回帰情報
との比較結果である。図で破線が正確な回帰情報を示
し、実線は本シミュレーションにおけるロボットの動き
を示す。これによって本発明の学習型自己定位装置が自
律的に自己の位置情報を計算しているということが示さ
れている。

【０２５０】

【発明の効果】以上詳細に説明したように、本発明によ
れば移動体の運動情報を経路に従って積算した結果とし
ての回帰情報と、移動体の環境の状況を示すセンサ信号
などに基づく感覚情報とを統合することにより、移動体
の位置決めを自律的に行うことが可能となる。従来の通
常の三角測量法などでは、信号空間の符号化と、符号化
された空間に位相、すなわち距離を導入することが一度
に行われ、それらを結びつけるのはシステムの設計者の
役割であったが、の学習型定位装置を用いることによっ
て、そのような作業をシステムの設計者から切り離し、
移動体自体がそのような作業を自律的に遂行することが
可能となり、移動体の運動の自律化を達成するために寄
与するところが大きい。

【図面の簡単な説明】

【図１】本発明の学習型自己定位装置の原理構成を示す
ブロック図である。

【図２】本発明の学習型自己定位装置の全体構成を示す
ブロック図である。

【図３】相対方位を用いた回帰情報の更新を説明する図
である。

【図４】回帰情報処理部による処理の説明図である。

【図５】方位角を離散ガウス信号に変換するニューラル
ネットの例を示す図である。

【図６】図５のニューラルネットの４つのニューロンの
出力を示す図である。

【図７】４つのニューロンの出力強度比率を示す図（θ
＝４π／５）である。

【図８】方位角のレンジを１２個のニューロンで分割し
たときの出力を示す図である。

【図９】図８におけるニューロンの出力強度比率を示す
図（θ＝４π／５）である。

【図１０】回帰情報処理部のニューラルネットによる実
現方式を示す図である。

【図１１】感覚情報処理部の学習モードにおける処理の
説明図である。

【図１２】符号化されたフィルタの出力信号を示す図で
ある。

【図１３】超音波センサが障害物までの距離を測定して
いる状況の説明図である。

【図１４】超音波センサ信号を次元拡大するニューラル
ネットの説明図である。

【図１５】図１４のニューラルネットの各ニューロンの
出力強度を示す図である。

【図１６】図１４のニューラルネットの出力パターンを
示す図である。

【図１７】各センサに対応する障害物との距離および各
ニューロンの出力強度を示す図である。

【図１８】学習モードにおける感覚情報処理部のニュー
ラルネットによる実現方式を示す図である。

【図１９】感覚信号のプロトタイプ形成過程の説明図で
ある。

【図２０】荷重修正時における全順序の使用の効果を説
明する図である。

【図２１】実行モードにおける感覚情報処理部の処理の
説明図である。

【図２２】実行モードにおける感覚情報処理部のニュー
ラルネットによる実現方式を示す図である。

【図２３】情報統合部の学習モードにおける処理の説明
図である。

【図２４】学習モードにおける情報統合部のニューラル
ネットによる実現方式を示す図である。

【図２５】感覚信号プロトタイプと回帰ベクトルの対応
関係の説明図である。

【図２６】実行モードにおける情報統合部の処理の説明
図である。

【図２７】実行モードにおける情報統合部のニューラル
ネットによる実現方式を示す図である。

【図２８】想起された回帰ベクトルを用いて移動体が
原点まで回帰する例の説明図である。

【図２９】情報統合部において回帰ベクトルから感覚プ
ロトタイプ信号を想起するための学習処理の説明図であ
る。

【図３０】図２９の学習処理を実行するための情報統合
部のニューラルネットによる実現方式を示す図である。

【図３１】情報統合部において回帰ベクトルから感覚プ
ロトタイプ信号を想起する実行モードの処理の説明図で
ある。

【図３２】図３１の実行モードにおける情報統合部のニ
ューラルネットによる実現方式を示す図である。

【図３３】回帰ナビゲーションにおけるロボットと外界
のセンサ信号との関係の説明図である。

【図３４】学習終了後のロボットの位置決めの説明図で
ある。

【図３５】情報統合部の統合結果としての回帰ベクトル
場を示す図である。

【図３６】任意の地点から原点への回帰誤差を示す図で
ある。

【図３７】４つの地点に対する正しい回帰情報とロボッ
トの動きの比較を示す図である。

【符号の説明】

１回帰情報処理手段２感覚情報処理手段３情報統合手段１０学習型自己定位装置１１，１３センサ１２回帰情報処理部１４感覚情報処理部１５駆動制御装置１６情報統合部

Claims

【特許請求の範囲】

【請求項１】移動体が移動空間内における自己の位置
を定位するための自己定位装置において、該移動空間における移動体の原点からの相対位置に対応
する回帰情報を求める回帰情報処理手段と、該移動体の該相対位置における環境状況に対応する感覚
情報を求める感覚情報処理手段と、該回帰情報と感覚情報との相関を学習して該２つの情報
を統合した後に、感覚情報処理手段から入力される感覚
情報に対応する回帰情報を想起して出力する情報統合手
段とを備え、移動体が自律的に自己の位置を定位可能と
することを特徴とする学習型自己定位装置。
【請求項２】前記回帰情報処理手段が、移動体の運動
状態を示す運動信号を逐次積算して、該移動体の移動経
路上で前記回帰情報を求めることを特徴とする請求項１
記載の学習型自己定位装置。
【請求項３】前記回帰情報処理手段が、移動体の原点
からの距離と方向を示すセンサ信号の入力に対して、該
センサ信号を離散・局在化させた信号を前記運動信号と
して逐次積算することを特徴とする請求項２記載の学習
型自己定位装置。
【請求項４】前記感覚情報処理手段が、移動空間内の
任意の位置において、移動体を取り巻く環境の観測結果
に基づいて求められる感覚信号と、量子化された感覚信
号空間において分割された各領域の代表点との間の距離
に対応する値を前記感覚情報として前記情報統合手段に
出力することを特徴とする請求項１記載の学習型自己定
位装置。
【請求項５】前記感覚情報処理手段が、前記環境状況
を示すセンサ信号の入力に対して、該センサ信号を離散
・局在化させた信号を前記感覚信号とすることを特徴と
する請求項４記載の学習型自己定位装置。
【請求項６】前記感覚情報処理手段が、自己組織的に
学習を行うニューラルネットによって構成されること
と、該ニューラルネットが移動空間内の代表点に対応する前
記感覚信号のベクトルと、該ニューラルネットの出力層
ニューロンへの結合荷重のベクトルとの距離のうちで最
も該距離が小さい結合荷重のベクトルの更新量を最大と
する学習を行った後に、前記任意の位置における感覚情
報を前記情報統合手段に出力することを特徴とする請求
項４記載の学習型自己定位装置。
【請求項７】前記情報統合手段が、前記学習における
２つの情報の統合に際して、移動空間内の任意の点に対
する前記感覚信号と、前記分割された各領域の代表点と
の各距離に対応するそれぞれの値としての感覚情報の入
力に対して、該情報統合手段の内部で該それぞれの値の
うちの最大値が入力される結合の荷重として、該任意の
点に対応する回帰情報の値を学習することを特徴とする
請求項４記載の学習型自己定位装置。
【請求項８】前記情報統合手段が、前記分割された各
領域の代表点に対応する移動空間内の代表点に対する前
記回帰情報を基底として、移動空間内の任意の位置にお
ける前記感覚情報を該基底に対する重みとして用いて、
該任意の位置に対応する回帰情報を補間によって求める
ことを特徴とする請求項４記載の学習型自己定位装置。
【請求項９】移動体が移動空間内における自己の位置
を定位するための自己定位装置において、移動空間における移動体の原点からの相対位置に対応す
る回帰情報を求める回帰情報処理手段と、該移動体の該相対位置における環境状況に対応する感覚
情報を求める感覚情報処理手段と、該回帰情報と感覚情報との相関の学習において、該２つ
の情報を統合した後に、回帰情報処理手段から入力され
る回帰情報に対応する感覚情報を想起して出力する情報
統合手段とを備えたことを特徴とする学習型自己定位装
置。
【請求項１０】前記情報統合手段が、回帰情報空間内
の代表点に対応する感覚情報であって、量子化された感
覚信号空間において分割された各領域の代表点と、該回
帰情報空間内の代表点に対応する移動空間内の代表点に
対する感覚信号との間の距離に応じた値としての感覚情
報を基底とし、移動空間内の任意の点に対する回帰情報
を重みとして用いて、該任意の点に対応する感覚情報を
補間によって求めることを特徴とする請求項９記載の学
習型自己定位装置。
【請求項１１】移動体が移動空間内における自己の位
置を定位するための自己定位方法において、移動空間内における移動体の原点からの相対位置を示す
回帰情報を求め、該移動体の該相対位置における環境状況を示す感覚情報
を求め、該回帰情報と感覚情報との相関の学習において該２つの
情報を統合し、移動空間内の任意の位置に対する感覚情報に対応する回
帰情報を想起して出力し、移動体が自律的に自己の位置を定位可能とすることを特
徴とする学習型自己定位方法。
【請求項１２】移動体が移動空間内における自己の位
置を定位するための自己定位方法において、移動空間内における移動体の原点からの相対位置を示す
回帰情報を求め、該移動体の該相対位置における環境状況を示す感覚情報
を求め、該回帰情報と感覚情報との相関の学習において該２つの
情報を統合し、移動空間内の任意の位置に対する回帰情報に対応する感
覚情報を想起して出力することを特徴とする学習型自己
定位方法。