JPH10185589A - 学習型自己定位装置 - Google Patents

学習型自己定位装置

Info

Publication number
JPH10185589A
JPH10185589A JP8347705A JP34770596A JPH10185589A JP H10185589 A JPH10185589 A JP H10185589A JP 8347705 A JP8347705 A JP 8347705A JP 34770596 A JP34770596 A JP 34770596A JP H10185589 A JPH10185589 A JP H10185589A
Authority
JP
Japan
Prior art keywords
information
sensory
signal
learning
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8347705A
Other languages
English (en)
Other versions
JP3647584B2 (ja
Inventor
Masahiro Matsuoka
雅裕 松岡
Shinya Hosoki
信也 細木
Yoshiharu Maeda
芳晴 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP34770596A priority Critical patent/JP3647584B2/ja
Priority to US08/909,945 priority patent/US6018696A/en
Publication of JPH10185589A publication Critical patent/JPH10185589A/ja
Application granted granted Critical
Publication of JP3647584B2 publication Critical patent/JP3647584B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0268Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
    • G05D1/027Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means comprising intertial navigation means, e.g. azimuth detector
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0255Control of position or course in two dimensions specially adapted to land vehicles using acoustic signals, e.g. ultra-sonic singals
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0268Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means
    • G05D1/0272Control of position or course in two dimensions specially adapted to land vehicles using internal positioning means comprising means for registering the travel distance, e.g. revolutions of wheels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Length Measuring Devices With Unspecified Measuring Means (AREA)
  • Navigation (AREA)

Abstract

(57)【要約】 【課題】 ロボットや自動車などの移動体の位置決定方
式に関し、移動空間内において自己が存在する位置を自
律的に定位することができる学習型自己定位装置を提供
する。 【解決手段】 移動空間における移動体の原点からの相
対位置に対応する回帰情報を求める手段1と、移動体の
該相対位置における環境状況に対応する感覚情報を求め
る手段2と、回帰情報と感覚情報との相関を学習して2
つの情報を統合した後に、手段2から出力される感覚情
報に対応する回帰情報を想起する手段3とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は自律ロボットや自動
車などの移動体の位置決定方式に係り、更に詳しくは学
習によって移動空間内において自己が存在する位置を自
律的に定位することができる学習型自己定位装置に関す
る。
【0002】
【従来の技術】移動体の位置決めの問題は、ロボットや
自動車などの運動の自律化を達成するための基礎技術の
1つとして研究されている。通常、移動体の運動に関す
る情報、または絶対的な位置が分かる手掛かりとの相対
的な位置に関する情報から、移動体の位置の計算が行わ
れる。その技術は次の文献1に述べられており、次のよ
うにまとめることができる。
【0003】文献1:日本ロボット学会編、ロボット工
学ハンドブック、コロナ社(1990) 第1の技術はデットレコニングと呼ばれる方法である。
移動経路上での移動体と移動面との接触に関する情報か
ら、移動体の相対位置を推定する方法である。移動体の
平行移動は車輪の回転エンコーダや車輪速度センサ、オ
ドメータなどを利用して測定され、移動体の移動方向の
変化は、差動車輪の回転計算や、コンパスを利用して測
定される。そのような測定結果を積算することにより、
原点からの移動体の距離と方向が求められる。
【0004】第2の技術は慣性航行を利用する方法であ
る。この方法では、慣性座標系に対する運動計測が可能
な加速度センサと角速度センサとが組合わされて、位置
の推定が行われる。角速度センサの代わりに、絶対方位
を正確に検出できるジャイロコンパスを用いることによ
って、高精度の位置推定が可能となる。
【0005】第3の技術はビーコンシステムにおける三
角測量を用いる方法である。この方法では、移動空間内
に設けられたそれぞれのランドマークから移動体までの
距離、移動体を中心としたランドマークの間の相対的な
角度、およびランドマークの位置情報から、ランドマー
クの座標系における移動体の位置の計算が行われる。
【0006】この3つの方式には、位置決めに用いられ
る情報に応じて、様々な長所および短所がある。本発明
においては、位置決めに用いられる情報を回帰情報と感
覚情報に分けて、位置決めの問題を説明する。回帰情報
は移動体の運動に関する情報であり、移動体の運動状態
を計測するセンサの信号を処理することによって得ら
れ、感覚情報は移動体の環境に関する情報であり、例え
ばランドマークまでの距離や角度を計測するセンサ、絶
対方位を検知するセンサの信号を処理することによって
得られる。
【0007】第1の方法としてのデッドレコニングは回
帰情報を利用する方式であり、長所としてはシステムが
安価であり、移動経路がスリップなどが行らない良い状
態であれば位置決めの誤差は小さくなる。これに対して
短所としては、車輪のスリップによる誤差が累積するた
め、路面状態に応じた補正が必要であることがあげられ
る。
【0008】第2の方法としての慣性航行に基づく場合
には、回帰情報だけを利用する場合、すなわち機械式ジ
ャイロによって相対方位を検出する場合と、回帰情報と
感覚情報との両方を利用する場合、すなわちジャイロコ
ンパスによって絶対方位を検出する場合とがある。
【0009】第1の場合の回帰情報だけを利用する場合
の長所としては、慣性航行では速度センサ、加速度セン
サにより運動状態を測定して回帰情報を生成するので、
移動体の車輪と接触面の滑りによる誤差の累積を防ぐこ
とができることがあげられ、短所としては運動状態を計
測するセンサ信号の微小な誤差が累積すること、特に角
度情報の精度が問題になることがあげられる。機械的よ
りも光ファイバ式のジャイロを用いる方が精度が高く、
かつ小型になる。
【0010】回帰情報と感覚情報との両方を利用する場
合の長所としては、移動体の動輪と接触面の滑りによる
誤差の累積を防ぐことができ、また絶対方位を利用する
ことで正確な角度情報が得られるので、位置決めの性能
を大幅に改善することができることがあげられる。短所
としては超精密な装置が必要であり、値段が高いこと、
また一般的に反応の時定数が大きく、小型のシステムに
は向いていないことがあげられる。
【0011】第3の方法としての三角測量を用いる方法
は感覚情報を利用するものである。その長所としては、
累積誤差の問題がないことがあげれらる。これに対して
短所としては、マップ、ビーコン、ランドマークなど環
境の情報(ランドマークの位置情報が明記された地図)
をシステム設計の段階であらかじめ与える必要があり、
その地図の精度によって位置決めの精度が決定されてし
まうことがあげられる。
【0012】
【発明が解決しようとする課題】以上に述べた3つの方
法は、自律型ロボットの位置決めに対して、1つだけを
選んで単独で使うことはできない。まず第1および第2
の方法は、基本的には回帰情報を用いて経路を積算する
ものである。従って移動体を本来の移動方法をとること
なく任意の別の地点に運んだ場合、例えば自動車をトレ
ーラに乗せて任意の地点に運んだ場合に位置の情報が失
われ、位置決めを行うことができないという問題点があ
る。経路を積算する方法を用いる場合には、経路が連続
である限りは原点への直線距離と方位を情報として保持
できるが、経路が切断された場合にはそのような情報を
保持することができない。
【0013】第2の方法においてジャイロコンパスを利
用することが可能であったとしても、絶対方位は各地点
で等方性の情報であるため、位置情報の修正には用いる
ことができない。すなわち絶対方位として北の方向が示
されたとしても、その情報だけでは位置情報を修正する
ことができない。同様の意味で運動状態の信号に含まれ
る誤差の累積を修正することができないという問題点が
ある。
【0014】第3の方法としての感覚情報を用いた三角
測量法においては、システム設計者、もしくはユーザ
が、ロボットが置かれる環境の地図情報をあらかじめ与
えなければならないという問題点がある。更に環境が動
的に変化した場合に、地図情報の修正が必要になる。こ
のことは自律的な位置決めができないということを意味
し、更にランドマークが利用できないような状況では、
位置の確認をすることすら全くできないという問題点が
ある。
【0015】本発明は、回帰情報と感覚情報の両方を用
いて学習によって両方の情報を統合し、位置決めを自律
的に行うことができる学習型自己定位装置を提供するこ
とを目的とする。
【0016】
【課題を解決するための手段】図1は本発明の原理構成
ブロック図である。同図は移動体、例えばロボットが移
動空間内における自己の位置を定位するために、移動空
間における移動体に対する座標系を内的に生成して、移
動空間における自己を自律的に定位する学習型自己定位
装置の原理構成ブロック図である。
【0017】図1において、回帰情報処理手段1は例え
ば回帰情報処理部であり、移動空間における移動体、例
えばロボットの原点からの相対位置を示す回帰情報を求
めるものである。感覚情報処理手段2は、その相対位置
における移動体の環境状況に対応する感覚情報を求める
ものである。また情報統合手段3は、回帰情報処理手段
1の出力する回帰情報と、感覚情報処理手段2の出力す
る感覚情報との相関を学習して、これら2つの情報を統
合した後に、移動体が移動空間内の任意の位置から原点
まで回帰するナビゲーションなどの実行に際して、感覚
情報処理手段2から出力される感覚情報に対応する回帰
情報を想起して出力するものである。
【0018】回帰情報処理手段1は、移動体の運動状態
を示す運動信号、例えば単位時間内における移動体の移
動距離と、移動方向の変化量を示す信号を逐次積算し
て、移動体の移動経路上における回帰情報を求め、その
結果を情報統合手段3に出力する。
【0019】また、感覚情報処理手段2は、移動空間内
の任意の位置において、移動体を取り巻く環境の観測結
果に基づいて求められる感覚信号、例えばセンサから入
力される、移動体と複数のランドマークとの間の距離を
示す信号を離散・局在化させた結果としての感覚信号
と、量子化された感覚信号空間において分割された各領
域の代表点との距離に対応する値を、感覚情報として情
報統合手段3に出力する。
【0020】情報統合手段3は、学習時においては、例
えば任意の点に対する感覚信号と各領域の代表点との距
離に対応する値の入力に対して、情報統合手段3の内部
で各領域の代表点との距離に対応するそれぞれの値のう
ちで最大値が入力される結合の荷重として、その任意の
点に対応する回帰情報の値を学習し、実行時においては
前述の距離に対応する値の入力に対して、各領域の代表
点に対応する移動空間内の各点の回帰情報の値を用い
て、補間によって任意の点に対する回帰情報を想起す
る。
【0021】本発明においては、このように経路積算に
よって得られる回帰情報と、感覚信号空間、すなわち感
覚信号マップを用いて得られる感覚情報とを統合するこ
とによって、移動体の位置決めが自律的に行われる。こ
れらの情報の統合に際しては、回帰情報および感覚情報
が相互に参照・想起できるような形式で、統合が行われ
る。本発明の情報統合を用いた移動体の位置情報の計算
方式ては、感覚情報によって空間が符号化され、回帰情
報によって各符号の位相、すなわち各符号に対する移動
空間内の点の間の距離を決めることになる。従って同じ
情報を異なる方式で二重に処理していることにはなら
ず、移動体の自律的な位置決め、例えば自律型ロボット
における位置決め問題を解決することが可能になる。
【0022】
【発明の実施の形態】図2は本発明の学習型自己定位装
置の全体構成ブロック図である。同図において学習型自
己定位装置10は、センサ11から入力される運動状態
を示す信号に応じて符号化された回帰信号、すなわち回
帰情報を求める回帰情報処理部12、センサ13からの
環境を示す感覚信号の入力に応じて、符号化された感覚
信号、すなわち感覚情報を求める感覚情報処理部14、
回帰情報処理部12から入力される符号化された回帰信
号、すなわち回帰情報、および感覚情報処理部14から
出力される符号化された感覚信号、すなわち感覚情報を
統合して、その結果を移動体、例えばロボットの駆動制
御装置15に位置情報、すなわち後述する回帰ベクトル
として出力する情報統合部16から構成されている。こ
こで情報統合部16は、感覚情報をキーとする回帰情報
の想起を行うことも、またその逆に回帰情報をキーとす
る感覚信号の想起を行うこともできる。
【0023】図1において、回帰情報処理部12はセン
サ11から与えられる運動状態を表す信号を運動信号に
符号化し、各単位時間における移動距離と方向の変化量
とを積算することによって、原点に対する移動体の現在
位置の相対距離と方位を常に計算し、適切な表現として
の回帰情報に変換した後に情報統合部16に出力する。
【0024】感覚情報処理部14は、センサ13からの
信号を感覚信号空間上の点に対応するように符号化し、
ロボットの移動空間内の複数の代表点に対応して、感覚
信号空間上の代表点に相当する感覚信号のプロトタイプ
を生成し、その後生成されたプロトタイプに基づいて、
移動空間内の任意の点に対応すセンサ信号から符号化さ
れた感覚信号に独自の表現としての感覚情報を与え、情
報統合部16に出力する。
【0025】情報統合部16は、回帰情報処理部12お
よび感覚情報処理部14の出力を、学習によって相互に
想起できるように統合する。この学習の終了後に、感覚
情報処理部14から出力される感覚情報を用いて、移動
空間内の任意の点における位置情報を回帰情報として想
起することが可能になり、想起さた回帰情報、後述する
回帰ベクトルはロボットなどの駆動制御装置15に与え
られる。
【0026】図2の回帰情報処理部12では、前述のよ
うに移動体の移動経路に沿って得られる運動状態の信号
を積算して移動体、例えばロボットの現在の位置から原
点までの直線距離u、および方向φに対応する情報を時
々刻々計算し、その計算結果を保持する。この情報をロ
ボットが現在の位置から原点まで回帰するための情報と
して、回帰情報h(u,φ)と呼ぶことにする。この回
帰情報を表現するために、一般的なベクトルの代わりに
三角関数を用いた表現位相符号(フェーザコーディン
グ)を使用して、回帰情報を次式のように表す。
【0027】 h(u,φ)=ucos (ωk+φ) (1) ここでωは符号化のために用いる周波数である。このよ
うに回帰情報の表現のためにフェーザコーディングを使
用することについては、次の文献がある。
【0028】文献2:細木 信也、松岡 雅裕、前田
芳晴、学習型ベクトル演算装置、特願平8−19755
6号 文献3:D.S. Touretzky他、Neural Representation of
Space using Sinusoidal Arrays, Neural Computatio
n, Vol.5, pp.869 〜884 (1992) 文献2は出願人の先願であるが、この先願において出願
人はフェーザコーディングを用いた回帰情報の積算につ
いて開示している。このような方法は、回帰情報をベク
トルで直接表現する場合に比べて、まず平行移動および
回転移動を簡単な操作で実現でき、また簡単な回路、す
なわち加算器を用いて高精度の積算器を構成でき、更に
離散化によって分散表現が可能となるため、符号器や積
算器をより簡単な回路で構成できるなどの利点がある。
【0029】ロボットの方向、すなわち方位の表現方法
としては、絶対方位を用いる方法と相対方位を用いる方
法との2通りがある。後者の相対方位は、例えばロボッ
トの直進方向を基準とした、ロボットに貼り付けられた
座標(慣性座標系)上における方位を表す。前者の絶対
方位は、例えば北を基準とする移動平面上での方位を表
現するものである。感覚情報として絶対方位を利用する
ことができれば、回帰情報をよりコンパクトに表現する
ことかできる。
【0030】そこで最初に絶対方位による回帰情報の積
算について説明する。絶対方位の情報を用いる場合に
は、時刻tにおける回帰情報は次式で表される。 h(u(t) ,φ(t))=u(t) cos(ωk+φ(t)) (2) ここで、ロボットが単位時間に絶対方位でΔφの方向
に、距離Δuだけ移動した場合の回帰情報の修正量は次
式で与えられる。
【0031】 Δh(u(t),φ(t))=Δu cos(ωk+Δφ) (3) その結果、時刻t+1における回帰情報は次の(4) 〜
(6) 式で与えられ、これらの式から時刻t+1における
距離と方位は(7) および(8) 式によって与えられる。
【0032】
【数1】
【0033】回帰情報処理部12においては、以上の計
算が時々刻々行われ、,その結果としての回帰情報が保
持される。回帰情報の積算をより効率的に行うために、
位相符号をN次元のコサインベクトル(ここでは、“Si
nusoidal Array”をコサインベクトルと呼ぶことにす
る)に変換し、その上で積算操作を行う方法がある。位
相符号を離散化してコサインベクトルに変換することに
よって、位相符号とユニークに対応するN次元のコサイ
ンベクトルを用いた回帰情報の表現が得られる。回帰情
報処理部12による回帰情報の更新動作は次の(1) 〜
(4) のように行われる。 (1) センサから伝達されるロボットの運動状態に関する
信号を基にして、単位時間における移動方向Δφと移動
距離Δuを算出する。 (2) この単位時間に対応する回帰情報の修正量をN次元
コサインベクトルとして、次式のように求める。
【0034】
【数2】
【0035】(3) コサインベクトルとして保持されてい
る時刻tにおける回帰情報
【0036】
【数3】
【0037】を読み出す。 (4) 時刻t+1の回帰情報を求めるために、コサインベ
クトルの各要素(i=1,・・・,N)について次式の
計算を行う。
【0038】
【数4】
【0039】(5) 保持されている回帰情報を時刻tのも
のから時刻t+1のものに更新する。次に相対方位を用
いた回帰情報の更新について説明する。この場合も、原
理的には絶対方位を用いる場合と同じであるが、回帰情
報を表現するためにサイン関数とコサイン関数とを一対
にして用いる。これはロボットの向きに関する操作が必
要となるためである。相対方位による積算においては、
ロボットの車体の運動状態を微小時間における旋回と並
進とに分解し、それぞれの動作に応じて回帰情報の更新
が行われる。
【0040】相対方位を用いる場合には、ロボットの車
体に貼り付けられた極座標系において回帰情報はh(u
(t),Ψ(t))と表される。この回帰情報の表し方につい
て、図3を用いて説明する。方位Ψはロボットの進行方
向(移動体の表面に対して垂直で、かつ移動体の重心を
通る車体軸)と、原点と移動体の重心とを結ぶ線分とが
成す角を、左回りで0から2πの範囲で表すものとす
る。角度の表現としては、例えばロボットの向きに対し
て左回りに0からπ、右回りに0からπという形式など
も利用できる。角度の表現に応じた場合分けを行えば、
以下の説明は基本的に成立する。移動体の重心と原点と
の間の距離はu(t) で表される。
【0041】時刻tにおける回帰情報は次式によって表
される。 h(u(t), Ψ(t))=(u(t)cos( ωk+Ψ(t)),u(t)sin(ωk+Ψ(t))) (12) 図3(a) は時刻tでの旋回による方向Ψの更新の説明図
である。同図に示すように、時刻tにおいて車体軸がΔ
Ψだけ旋回したとすると、方位はΨ′となり、回帰情報
は次式のように与えられる。
【0042】 u(t)cos(ωk+Ψ′(t))=u(t)cos(ωk+Ψ(t) −ΔΨ) (13) u(t)sin(ωk+Ψ′(t))=u(t)sin(ωk+Ψ(t) −ΔΨ) (14) ここで旋回に対しては時刻tをt+1に更新せず、次に
説明する並進を含めて時刻の更新が行われる。
【0043】(13)および(14)式を行列表現を用いて書き
直すと次式が得られる。
【0044】
【数5】
【0045】時刻tでの並進による位置情報の更新を図
3(b) を用いて説明する。移動体が、ΔΨの旋回の後
に、車体軸の方向に対してΔθの方向にΔuだけ移動し
たとすると、時刻t+1における回帰情報は次式のよう
に与えられる。
【0046】
【数6】
【0047】この移動後の時刻t+1における移動体の
位置が、図3(c) に示されている。相対方位を用いる場
合にも、位相符号を離散化することによって、位相符号
にユニークに対応するN次元のコサインベクトルと、N
次元サインベクトルが回帰情報の表現として得られる。
この場合には、回帰情報の更新は次の(1) 〜(6) の順序
で行われる。 (1) 絶対方位を用いる場合と同様に、センサから伝達さ
れるロボットの運動信号を基にして、単位時間における
旋回角ΔΨ、移動方向Δθ、および移動距離Δuを算出
する。 (2) 旋回を表す行列と、並進による修正に必要なN次
元コサインベクトルとN次元サインベクトルを、次式に
よって求める。
【0048】
【数7】
【0049】(3) 時刻tにおける回帰情報を表すN次元
コサインベクトルとN次元サインベクトルを読み込む。
【0050】
【数8】
【0051】(4) 車体の旋回ΔΨによる回帰情報の修正
として、コサインベクトルとサインベクトルの各要素
(i=1,・・・,N)に対して次式を計算する。
【0052】
【数9】
【0053】(5) 旋回の修正が成されたコサインベクト
ルとサインベクトルの各要素について、次式によって並
進による修正を行う。
【0054】
【数10】
【0055】(6) 回帰情報を時刻tから時刻t+1のも
のに更新する。次に回帰情報処理部12による処理につ
いて図4を用いて説明する。同図において、センサによ
って得られる方位は、ステップS1においてガウス・フ
ィルタを用いて離散・局在化され、離散ガウス関数信号
が得られる。この離散ガウス関数信号の求め方について
は詳しく後述する。
【0056】続いてステップS2で、この離散ガウス関
数信号を用いてコサインベクトルとしての方位情報が復
元され、離散コサイン関数信号が得られる。ステップS
3でこの離散コサイン関数信号と単位時間移動距離とが
乗算されて、移動ベクトルが復元される。この単位時間
移動距離の乗算は、例えば(9) 式におけるΔuとコサイ
ン関数との積に相当する。
【0057】ステップS3で単位時間における移動ベク
トルが復元されると、その結果はステップS4で1単位
時間前の回帰ベクトル、すなわちコサインベクトルとベ
クトル加算器によって加算去れ、回帰ベクトルの更新が
行われ、新しい回帰情報が、離散コサイン関数信号によ
る回帰ベクトルとして得られる。更にこの回帰情報は、
1単位時間後のベクトル加算器による加算に備えて、ス
テップS5で短期保持されると共に、例えばノイズ除去
が行われる。
【0058】図4における処理のうちステップS1、す
なわちガウス・フィルタによる方位の離散・局在化につ
いて、図5〜図9を用いて説明する。図5は方位角を離
散ガウス関数信号に変換するニューラルネットの例であ
る。このニューラルネットは、方位角θを0から2πの
範囲でニューロンの出力強度に変換し、ニューラルネッ
トの出力パターンとして空間的な符号化を行うものであ
る。各ニューロンC1〜C4は荷重と入力を比較し、比
較結果に基づいて出力を決定する。図5では一次元の信
号としての方位角θが、4つのニューロンの出力として
の四次元の信号に変換されており、センサ信号の次元拡
大が行われている。
【0059】図6は4つのニューロンC1〜C4の出力
強度を示す。同図に示すように、4つのニューロンはそ
れぞれに与えられた荷重に応じて4つのガウス型の受容
野を持ち、入力の方位角に応じた出力を与えることにな
る。各ニューロンの荷重mi(i=1,2,3,4)は
C1に対してはπ/4,C2に対しては3π/4、C3
に対しては5π/4、C4に対しては7π/4に設定さ
れており、受容野を決める出力関数fi (i=1,2,
3,4)は次式によって与えられている。また出力関数
の形状を決める分散の値は、方位角の情報ができる限り
歪まないように選ばれ、ここでは1ラジアンに設定され
ている。
【0060】 fi =exp 〔0.5(θ−mi 2 〕(i=1,2,3,4) (25) 図7は方位角としてθ=4π/5が入力された時の各ニ
ューロンの出力強度比率を示す。この比率qi (i=
1,2,3,4)は各ニューロンの出力を全体の出力の
総和で規格化したものである。それぞれのニューロンの
出力比率は次のようになり、入力方位角に強く反応する
ニューロンはC2である。
【0061】(q1,2,3,4 )=(0.14115, 0.620
338, 0.231205, 0.0073078) 図8は図5よりニューロンの数を増やし、0〜2πの方
位角のレンジを12個のニューロンで分割した場合の出
力強度である。1個あたりのニューロンの受容野は小さ
くなり、それぞれのニューロンの出力関数は次式のよう
になる。
【0062】
【数11】
【0063】図9は、図8のように12個のニューロン
を用いた場合に、方位角としてのθ=4π/5の入力に
対する出力強度比率を示す。各ニューロンの出力強度比
率は次のようになる。入力方位角に強く反応するニュー
ロンはネットワーク全体の中の小さな領域に限定される
ことになり、入力方位角の情報は空間的に局在化した形
で表現される。
【0064】(q1, q2, q3, q4, q5, q6, q7, q8, q9,
q10,q11,q12)=(0.0000,0.0000,0.0000, 0.0446, 0.7
333, 0.2209, 0.0012, 0.0000, 0.0000, 0.0000, 0.000
0,0.0000) 次に回帰情報処理部の構成について説明する。図10は
回帰情報処理部12のニューラルネットによる実現方式
を示す。このニューラルネットは、先願としての文献2
におけるベクトル演算装置と同様の動作を行うものであ
るが、その動作について簡単に説明する。まず運動状態
センサから入力される方位角変化量Δφ (n) は、信号の
離散・局在化を行うガウスフィルタとしてのニューラル
ネット21によって前述のように信号の局在化が行われ
た後に、コサイン行列による信号変換部22に与えられ
る。
【0065】この信号変換部22は出力層ニューロン2
5に対応する入力荷重を与えるものであり、ガウスフィ
ルタとしてのニューラルネット21のニューロンを入力
層として動作するニューラルネットの入力荷重を表す。
【0066】入力層を構成するニューロン、ここではガ
ウスフィルタとしてのニューラルネット21のニューロ
ンをM個とし、出力層25のニューロンをN個とする。
一般にMはNに比べて充分に大きいものとする。入力層
21のニューロンはガウス型の受容野を持ち、その受容
野の広さは充分に狭いものとする。出力層25の素子は
入力の荷重和を線形的に出力するものとする。
【0067】コサイン行列による信号変換部22は方位
角の空間的な符号化を行うものであり、回帰ベクトルの
計算では方位角をコサイン関数を用いた表現に変換する
必要がある。入力層のニューロン21のインデックスを
j=1,2,・・・,M、出力層25のニューロンのイ
ンデックスをi=1,2,・・・,Nとする。入力層ニ
ューロンから出力層ニューロンへの結合荷重、すなわち
変換部22におけるコサイン行列を構成する結合荷重S
ijを次式によって設定する。
【0068】
【数12】
【0069】入力層ニューロンの出力をYi ,これに対
応する出力層ニューロンの出力をh i とする。前述のよ
うに入力層21のニューロンの中には、方位角変化量Δ
φ(n ) に対して強く反応するニューロンkが存在し、そ
の出力は“1”となるのに対して、その他の素子は反応
せず、出力は“0”となる。強く反応するニューロンが
1個だけであるとすれば、Δφ (n) (2π/M)kと
なることを意味し、方位角の変化量の信号は結局、出力
層のi番目のニューロンに対して、次式で示される分だ
け作用することになる。
【0070】
【数13】
【0071】従って方位角に関する入力信号の出力層ユ
ニットの出力への影響は、次式によって与えられること
になる。
【0072】
【数14】
【0073】この出力の影響分に対して、移動距離に対
する変換部23によって、移動距離に関する入力信号Δ
(n) に応じてシナップス結合による情報の修飾と呼ば
れる動作が行われ、この影響分は次式で示すように変換
される。
【0074】
【数15】
【0075】これによって微小時間における回帰ベクト
ルの変化が(30)式で示すように符号化され、出力層ニュ
ーロンにおいて25加算されることになる。次のコサイ
ン行列による信号安定化部24の動作を説明する。この
信号安定化部は、時刻nの回帰ベクトルに微小時間にお
ける回帰ベクトルの変化量を加算して、時刻n+1にお
ける回帰ベクトルを求めるものである。出力層25の各
素子の時刻n+1における出力の値は、次式によって与
えられることになる。
【0076】
【数16】
【0077】この計算を実行するためには時刻nにおけ
る回帰ベクトルを一時的に保存するための短期記憶を必
要とする。この短期記憶は再帰結合の荷重、すなわちコ
サイン行列による信号安定化部24の内部に黒丸で示さ
れた結合の荷重Tikによって実現される。
【0078】この荷重Tikは次式が成立するように設定
される。
【0079】
【数17】
【0080】自明な結合荷重としてクロネッカーのデル
タδikがある。これを用いると次式によりTikが与えら
れる。 Tik=1(i=k),Tik=0(i≠k) (33) この自明な結合荷重以外の結合荷重として次式で与えら
れる結合荷重が存在する。
【0081】
【数18】
【0082】この結合荷重によって短期記憶が実現され
ることと、同時に出力層においてバイアスbが存在する
場合にも、そのバイアスが除かれて時刻nにおける回帰
ベクトルの値が正しく取り出せることを以下に示す。す
なわち次式が成立することを証明する。
【0083】
【数19】
【0084】(35)式を証明するために、はじめに
【0085】
【数20】
【0086】を示す。
【0087】
【数21】
【0088】という関係がある。jは虚数単位である。
【0089】
【数22】
【0090】
【数23】
【0091】この変形過程で第2行は第1行のejxにe
jx(N-1)/2 を、その後の分数式の分母に−e-jx/2 を、
また分子に−e-jx N/2 を乗ずることによって得られ
る。式〔3〕と式〔4〕の実部と虚部をそれぞれ比べる
と、式〔1〕と式〔2〕が成り立つことが判る。
【0092】次に式〔1〕と式〔2〕にx=2π/Nを
代入すると、
【0093】
【数24】
【0094】が成り立つことが判る。また、x=4π/
Nを代入しても同様に
【0095】
【数25】
【0096】が得られる。次に任意の位相シフトφにつ
いて
【0097】
【数26】
【0098】を示す。ΣN k=1 cos((2π/N)k+φ)
を加法定理を使って、
【0099】
【数27】
【0100】と変形し、式〔5〕と式〔6〕を代入する
と、式
〔9〕になる。同様に加法定理を使って
【0101】
【数28】
【0102】を計算し、式〔5〕と式〔6〕を代入する
と、式〔10〕を導くことができる。同様の議論で
【0103】
【数29】
【0104】を導くことができる。ここで式
〔9〕と式
〔10〕は任意のφで成立するので、φ=−(2π/N)
iにおいても成立する。従って、
【0105】
【数30】
【0106】また式〔13〕と式〔14〕は任意のφで成立
するので、φ=−(4π/N)iにおいても成立する。
【0107】
【数31】
【0108】以上のことを踏まえて、
【0109】
【数32】
【0110】が得られる。式〔15〕を代入すると右辺の
第2項(bがかかっている項)が消えて
【0111】
【数33】
【0112】となる。これを
【0113】
【数34】
【0114】と変形し、加法定理を適用することで、
【0115】
【数35】
【0116】を得る。ここで
【0117】
【数36】
【0118】という関係式を使ってさらに変形する。
【0119】
【数37】
【0120】ここで、式〔17〕と式〔18〕を代入する
と、
【0121】
【数38】
【0122】となり、(35)式が成立することが証明され
た。以上のように、(34)式で与えられる再帰結合の荷重
を用いれば再帰結合が短期記憶として機能するだけでな
く、バイアスが除かれることが分かる。この結合荷重行
列の固有値を考えると、
【0123】
【数39】
【0124】に対応する固有値の絶対値は“1”であ
り、その他の固有値の絶対値は“1”より小さくなる。
もし回帰ベクトル信号に周波数2π/Nとは異なる周波
数の成分が混入していても、その異なる成分にとっては
再帰結合による変換は縮小写像として作用するため、回
帰ベクトルを積算していく過程で繰り返される計算によ
ってその成分は消失する。これはノイズの蓄積が生じな
いことを意味する。
【0125】次に感覚情報処理部14の動作について図
11を用いて説明する。感覚情報処理部は、例えばロボ
ットの移動空間内の複数のランドマークとロボットとの
距離を示すセンサ信号の入力に応じて、センサ信号を感
覚信号に符号化する。
【0126】感覚情報処理部14は、例えばニューラル
ネットワークによって構成され、その学習モードにおい
ては、入力層のニューロンに入力される感覚信号ベクト
ルと比較した場合に、各入力層ニューロンからの重みを
1つのベクトルと考えた重みベクトルとの差が最も小さ
い出力層ニューロンが勝者ニューロンとされ、その勝者
ニューロンに対して最も大きく重みの変更が行われる自
己組織化学習が実行される。本実施例では学習終了後の
この入力重みベクトル、すなわち出力層の各ニューロン
への重みベクトルを、感覚信号空間におけるプロトタイ
プと呼ぶことにする。
【0127】この自己組織化学習については、Kohonen
のフィーチャーマップアルゴリズムの他に、ニューラル
ガスアルゴリズムやグローイングセルストラクチャがあ
り、これらのアルゴリズムについては次の文献に記述さ
れている。
【0128】文献4:T.kohonen: The Self-Organizing
Map, Proc. IEEE, Vol.78, No.9,pp.1464 〜1480 (199
0) 文献5:T.M.Martinetz 他:“Neural-Gas”Network fo
r Vector Quantization and its Application to time-
Series Prediction, IEEE Trans. on Neural Networks,
Vol.4, No.4, pp.558〜569 (1993) 文献6:B.Fritzke, Growing Cell Structures-A Self-
Organizing Network for Unsupervised and Supervised
Learning, Neural Networks, Vol.7, No.9, pp.1441〜
1460 (1994) 図11において、センサ信号の入力に対応て、ステップ
S11で座標変換によるセンサ信号の局所線形化などが
行われた後に、ステップS12でガウス関数などのラジ
アルベース関数を用いたセンサ信号の離散・局在化が行
われて、感覚信号が得られる。
【0129】ここでラジアルベース関数とは、関数の近
似や補間において基底として用いられるものであり、ガ
ウス関数以外に双曲線関数などがある。ラジアルベース
関数をgi (x) とすると、任意の関数は次式のように表
される。
【0130】
【数40】
【0131】一般にt∈[0,1]上に定義された任意
の実数値関数f(t) を、ある連続関数の系列g1(t),・
・・,gn (t) ,・・・の線型結合
【0132】
【数41】
【0133】で書ける場合に、各gi (t) は任意の実数
値関数f(t) の基底関数と呼ばれる。例えば1,x,x
2 ,・・・,xn ,・・・は任意の実数値関数を次の形
式で表現する。有限個の重ね合わせでも高精度の近似が
実現される。
【0134】
【数42】
【0135】続いてステップS13でセンサ信号から得
られたこの感覚信号と現在の各プロトタイプ候補、すな
わちニューラルネットワークにおける各出力層ニューロ
ンへの入力重みベクトルとの距離の比較が行われ、ステ
ップS14で入力感覚信号ベクトルと最も近いプロトタ
イプ候補が決定され、学習信号が得られる。そしてこの
学習信号を用いて、自己組織化による学習として、ステ
ップS15で更新ルールに従って各プロトタイプ候補の
更新が行われる。この学習信号と更新ルールについては
詳しく後述する。
【0136】そしてステップS16で学習結果の評価の
ために学習スケジュールが評価され、例えば学習回数が
上限値を越えていない場合には、次のセンサ信号に対す
る学習を行うためにステップS17で信号入力待ちとな
り、センサ信号の入力に応じてステップS11からの処
理が繰り返される。ステップS16の学習スケジュール
評価において学習回数が上限値を越えていれば、感覚情
報処理部14の学習は終了し、その時点のプロトタイプ
候補が感覚信号に対するプロトタイプとされる。
【0137】まず図11におけるセンサ信号のガウス関
数による離散・局在化(S12)の処理について説明す
る。ここで次元拡大が行われるセンサ信号の次元は、セ
ンサの種類と個数、およびレンジで決まる。例えば移動
体に備えられるセンサとして超音波センサだけを用いる
ことにする。超音波センサは4個であり、それぞれ4つ
の方向について障害物や壁までの距離を計測するものと
する。この時センサ信号空間は4次元である。
【0138】各超音波センサは0から3mまでの計測範
囲、すなわちレンジを持つものとし、このレンジをフィ
ルタを用いて3つの部分レンジに分割することにすれ
ば、図12に示すような符号化されたフィルタの出力信
号が得られる。このような符号化を行うことにより、1
つのセンサ信号を3次元のベクトルで表現できることに
なり、結果としてフィルタで次元拡大されたセンサ信号
空間は12次元となる。図12と異なって部分レンジが
重なりあうように分割してもよいことは当然である。
【0139】ロボットと障害物との距離に対応したセン
サ信号の次元拡大の具体例について、図13〜図17を
用いて更に詳しく説明する。図13はロボットに備えら
れた4個の超音波センサS1〜S4が、それぞれ4個の
障害物までの距離を測定している状況を示す。楕円がロ
ボットであり、黒く塗り潰された四角形が障害物であ
る。センサS1は障害物が1.5 〜2.5 mのレンジに存在
することを、それぞれ以外のセンサは 2.5mを越えてい
ることを検出する。
【0140】図14は図13の4つのセンサ信号を、1
個のセンサあたり、ガウス型の受容野を持つ3個のニュ
ーロンでレジン分割し、センサ信号を次元拡大するニュ
ーラルネットの説明図である。同図においては、1個の
センサからの信号に対して、それぞれ荷重として 0.5,
1.5 および2.5 mを用いた3つのニューロンで3つの部
分レンジに分解し、各ニューロンの出力強度でセンサと
障害物との距離を離散・局在化させて表現するものとす
る。各ニューロンの出力関数は図6で説明したものと同
様とし、分散の値としては 0.5mを用いる。
【0141】図15は図14のニューラルネットによる
各ニューロンの出力強度を示す。各ニューロンの出力強
度は、荷重を中心とするガウス型の関数となっている。
図中に各センサS1〜S4によって検出される障害物の
距離が示されている。
【0142】図16は図14のニューラルネットの出力
パターンを示す。x1〜x12の各ニューロンは、図1
5における各センサで検出される障害物の位置に応じた
出力を与えることになる。このようにセンサ1個あたり
のニューロンの数を増やし、受容野の分散を小さくする
と、出力の大きいニューロンはニューラルネット全体の
中でごく小さな部分に過ぎなくなることが分かる。この
ような活発な領域は、センサと障害物との距離に応じて
移動する。多次元の信号に変換された信号の各要素の大
部分は0に近い値となり、情報を直接担うニューロンは
ごく一部のものとなる。
【0143】図17は各センサとそれに対応する障害物
との距離、および各ニューロンの出力強度をまとめたも
のである。次に感覚情報処理部14における学習アルゴ
リズムについてさらに説明する。図18は感覚情報処理
部のニューラルネットによる実現の説明図である。この
ニューラルネットは12個の入力層ニューロン、すなわ
ち入力素子と、9個の出力層ニューロン、すなわち出力
素子から構成され、各出力素子に対して、入力素子から
与えられる信号に対する荷重は可変であり、自己組織化
学習ルールによってこの荷重の更新が行われる。
【0144】入力素子に与えられる感覚信号、すなわち
ガウスフィルタによって次元拡大されたセンサ信号は、
例えば図14のニューラルネットによって与えられるも
のであり、これに対して入力素子の数は12個となって
いる。一方、出力素子の数は感覚信号空間におけるプロ
トタイプの数に対応し、ここでは9個となっている。
【0145】図18のニューラルネットにおいて、感覚
信号ベクトルの入力に対して、このベクトルと各出力素
子の入力荷重ベクトルとの距離に応じた値を用いて、自
己組織化学習ルールによって荷重が更新される学習処理
が行われる。この学習処理においては、感覚信号空間X
を示す曲面が自己組織化アルゴリズムによって量子化さ
れる。
【0146】この量子化は、例えばフィーチャーマップ
アルゴリズムによって、量子化される。この量子化は、
例えばフィーチャーマップアルゴリズムによって、感覚
信号空間内の曲面Mに前述のプロトタイプとての格子を
各格子間が等距離になるように埋め込むものである。信
号空間の曲面Mが全せい的(すなわち平面もしくは球面
の一部)でない場合には、フィーチャーマップアルゴリ
ズムによって歪みのないマップを作ることは困難であ
り、この場合にはニューラルガスアルゴリズムや、グロ
ーイングセルストラクチャを用いることにより、歪みの
ないマップを作ることができる。本実施例では、実装が
容易なニューラルガスアルゴリズムを用いて感覚信号の
プロトタイプを生成することにする。
【0147】移動体、すなわちロボットは移動空間上で
ランダムウォークを行うものとする。そのランダムウォ
ークは次式によって示される。 h(t) =u(t-1) cos(ωk+φ(t-1) ) +Δu (t-1) cos(ωk+Δφ(t-1) ) (36) ここでΔu(t-1) は一定の微小量であり、Δφ(t-1)
0〜2πの範囲でランダムに選ばれるものとする。ωk
は符号化に用いられる定数である。
【0148】移動体のセンサから得られる信号は↓s
(h(t) ) とする(なお、本文中、ベクトル記号には下
矢「↓」を付記して表現する)。このセンサ信号は前述
のように次元拡大されて、多次元の感覚信号空間X内の
曲面M上の信号↓x(h(t) )となる。この信号を簡単
のために↓x(t) と書くことにする。
【0149】図18のニューラルネットの入力素子への
入力信号は感覚信号空間の全せい的な曲面M上の点↓x
(t) であり、出力素子からの出力は感覚信号空間に各格
子間が等距離に埋め込まれる格子、すなわちプロトタイ
プ{↓w1 ,・・・,↓wM}の各候補(学習によって
プロトタイプに収束する)と入力信号としての↓x(t )
との距離に応じた値である。
【0150】入力信号↓x(t) に対する各出力素子の出
力yi (t) (i=1,2,・・・,M)は次式によって
与えられるものとする。
【0151】
【数43】
【0152】各出力素子の入力荷重の更新における全順
序ki は各素子の出力の大きな順、すなわち次の不等式
の順に決定される。
【0153】
【数44】
【0154】この全順序についてはさらに後述する。学
習の回数の上限はtmax 、学習のスケジュール関数η
(t)とλ(t)は共に単調減小関数とし、スケジュー
ルに関する定数については次の関係があるものとする。
【0155】η1 >η2 >0, λ1 >λ2 >0 また各出力素子の受容野の広さσi は正とし、規格化定
数ξi も正とする。図18のニューラルネットによるプ
ロトタイプ生成の手順は、次の(1) 〜(6)によって行わ
れる。 (1) ネットワークの初期化、各(出力)素子は識別子i
=1,2,・・・,Mにより区別される。ランダムな微
小値を選択することで各素子の入力荷重ベクトルである
↓wi (0) ,{i=1,2,・・・,M)を初期化す
る。 (2) t←1として学習を開始する。 (3) 感覚信号↓x(t) を読み込む。 (4) 感覚信号↓x(t) と各入力荷重から各素子の出力を
計算してそれに基づく各素子間の全順序ki を計算す
る。 (5) 全順序に基づいて入力荷重を修正する。
【0156】
【数45】
【0157】(6) t←t+1,t>tmax であれば学習
を終了する。さもなければ(3) に戻る。このプロトタイ
プ形成のアルゴリズムによって、入力ベクトル↓x(t)
が感覚信号空間の曲面上の一様な分布に従って生成され
るならば、曲面全体を一様に被覆するプロトタイプ{↓
1 ,・・・,↓wM }が得られる。感覚信号曲面が全
せい的であれば、このプロトタイプはこの曲面を一様に
量子化するものとなり、ロボットの移動空間に一様に分
布する代表点と1対1に対応するものとなる。
【0158】図19は感覚信号空間内の曲面上を一様に
被覆するプロトタイプ形成過程の説明図である。同図に
おいては、3つの座標軸によって感覚信号空間全体が3
次元以上の高次元空間であることが表されている。図中
の大きな長方形がセンサ信号を次元拡大した結果として
の感覚信号の曲面であり、白い円はニューラルネットの
各出力素子の荷重を表すものとする。図18の9個の出
力素子の入力荷重を表す白い円が感覚信号曲面の全体を
一様に被覆する9個のプロトタイプとなる過程を説明す
る。小さな長方形は最終的には得られるプロトタイプの
近傍である。
【0159】まず最初にランダムな値によって入力荷重
が初期化される。この初期荷重の曲面上における位置を
(1) に示す。前述のようにロボットはランダムウォーク
を行いながら、移動空間全体を移動し、センサ信号を出
力する。このセンサ信号は、次元が拡大された後に感覚
信号としてニューラルネットに入力される。
【0160】図19(2) において、入力された感覚信号
は黒で塗りつぶされた四角で表される。この入力感覚信
号に対して各荷重との間の距離が計算される。但しこの
計算においては感覚信号空間上に定義されている距離が
用いられる。そして計算された距離に基づいて各荷重に
対する修正における全順序が決定され、その順序に基づ
いて荷重の修正が行われる。
【0161】この時最も順位の高い荷重が入力された感
覚信号に最も近づくように修正が行われる。すなわち距
離の近い荷重ほど荷重の修正量が大きくなる。残りの荷
重に対しても順位に応じて入力された感覚信号の方向へ
の修正が行われる。この修正量は順位が下がるに従って
指数関数的に減少するように設定される。(3) はこのよ
うな修正によって新しく得られた荷重の分布を示す。
【0162】(4) において新しい感覚信号が入力され、
これに対応して荷重修正における全順序が計算され、順
位に応じて荷重の修正が行われ、その結果として(5) に
示す荷重の分布が得られる。以下同様に(6) において新
しい感覚信号の入力が行われ、荷重の修正処理が行われ
る。このような入力荷重の修正量は時間と共に単調に減
少するように処理が行われ、最終的に(N)に示すよう
に各荷重は感覚信号曲面全体を一様に被覆するプロトタ
イプに収束する。
【0163】図20は荷重修正時における全順序の使用
の効果の説明図である。この全順序に基づいて荷重の修
正を行うことによって、空間に特異点があるような場合
においても、信号曲面全体を一様に被覆するように格子
点、すなわちプロトタイプをうまく埋め込むことができ
るようになる。
【0164】通常のユークリッド距離や内積による距離
を用いる場合には、対象となる空間に対して厳しい条件
が課せられる。例えば特異点が存在しないことや、全体
が連結の領域であること、空間の曲率が一定であること
などが要求される。従って不連結領域や特異点が存在す
るような空間で、ユークリッド距離に基づいて自己組織
的なプロトタイプ生成アルゴリズムを実行してもうまく
いかないことになる。
【0165】図20(a) は対象となる信号曲面を示し、
この信号曲面は捻じれていて、アルファベットのCのよ
うな形状になっている。信号曲面上の点pは、2つの点
aとbに対してユークリッド距離をとる場合には等距離
にあるものとする。しかしながら点pとbとの間には信
号曲面に含まれない領域が存在する。
【0166】従ってフィーチャーマップアルゴリズムを
適用する場合には、点aの近傍と点bの近傍を点pに対
して同様に取り扱うことはできない。なぜならフィーチ
ャーマップアルゴリズムでは、被覆すべき信号曲面の任
意の点の近傍は、ユークリッド距離に基づいて連続であ
ることが要求されるからである。点pに対する点bの距
離は、フィーチャーマップアルゴリズムでは、図に示す
ように信号曲面の穴に沿った遠回りの経路で測定される
ことになる。
【0167】図20(b) はフィーチャーマップアルゴリ
ズムを用いた場合のプロトタイプによる信号曲面の被覆
結果である。図中の黒く塗りつぶした小さな円がプロト
タイプを表し、プロトタイプの間の隣接関係はプロトタ
イプを結ぶ格子として表されている。信号曲面全体をプ
ロトタイプでうまく一様に被覆することができないこと
が明らかであり、このような結果は実験によって確認す
ることができる。
【0168】(c) はニューラルガスアルゴリズムによる
被覆結果を示す。このアルゴリズムでは全順序に基づい
て重みの修正が行われるが、この修正における距離は点
と点との隣接関係で定義されているため、点と点との間
がどのような状態であってもユニークに距離が決定され
る。従って信号曲面の形状に左右されることなく、プロ
トタイプは信号曲面全体を一様に被覆するものとなる。
【0169】このように、ニューラルガスアルゴリズム
によれば、プロトタイプの形成の様子は、信号曲面の連
続性および連結性などに依存しないことが実験によって
も確認される。ニューラルガスアルゴリズムでは、プロ
トタイプの生成と隣接関係の埋め込みは分割して行われ
るため、マップに歪みが生じることはない。本実施例に
おけるプロトタイピングにおいて望ましい性質は、信号
曲面の均一な被覆と隣接関係の保存であり、このような
性質を不連結領域や特異点のある空間においても保証す
る方法として最も簡単なものが全順序に基づく入力荷重
の修正である。
【0170】図21は感覚情報処理部14の実行モード
における処理の説明図、図22は感覚情報処理部14の
ニューラルネットよる実現方式の説明図である。学習が
終了した感覚情報処理部14は、実行モードにおいて、
ロボットが自分で動くのではなく、例えば自動車などに
積まれて移動空間内の未知の任意の点に下ろされた時、
その点におけるセンサ信号を基にしてその地点に対応す
るユニークな感覚情報を出力し、それを情報統合部16
に与えることによって、情報統合部16がそのユニーク
な感覚信号の値に対応する移動空間上の点の位置を、回
帰情報として出力することを可能にさせたものである。
【0171】図21において、ステップS11およびS
12の処理は図11におけると同様であり、任意の点に
対応するセンサ信号は感覚信号空間の信号曲面上の点に
対応する感覚信号に変換される。
【0172】そして図22に示されるようにその感覚信
号、すなわちガウスフィルタによって次元拡大されたセ
ンサ信号はニューラルネットの入力素子に与えられ、図
21のステップS18にあるようにプロトタイプとの照
合が行われ、各プロトタイプ、図22では9つのプロト
タイプとセンサ信号との間の距離の評価が行われ、ステ
ップS19でその距離に応じた符号化として荷重に基づ
いたベクトル符号化が行われ、感覚情報、すなわちプロ
トタイプと入力信号との距離に応じた値として、情報統
合部16に出力される。
【0173】図22において、9つのプロトタイプに対
応する出力素子に対する入力荷重、すなわち結合荷重行
列の各行は感覚信号空間のプロトタイプに対応し、各出
力素子は感覚信号空間のプロトタイプと入力信号との距
離に応じた値を計算することになる。
【0174】次に情報統合部16の動作について説明す
る。図23は情報統合部16の学習モードにおける処理
の説明図、図24は学習モードにおけるニューラルネッ
トによる実現方式の説明図である。情報統合部16は時
間的な相関に基づいて感覚情報と回帰情報とを統合する
ものである。感覚情報処理部14におけるプロトタイプ
の集合は、移動空間を分割する代表点の集合と一対一に
対応する。しかしながら感覚信号単独では、プロトタイ
プとの間の距離情報と移動空間内における代表点の間の
距離との関係を確定することができない。その理想は移
動距離や方向の情報があって初めて感覚信号の変化量を
計算可能になるからである。
【0175】感覚信号の微小変化がロボットの運動の微
小変化と対応づけられることにより、移動空間の連続性
が再現される。これによって空間の位置情報を表現する
ことが可能となり、回帰情報と感覚情報を統合すること
によって、初めてロボットは移動空間の座標系を自律的
に獲得することが可能となり、その作業から設計者を除
くことができる。空間の座標系を生成するにあたって
は、情報統合部16が同時に受け取った異なるセンサの
信号の間には強い関連性があるという条件付け原理、こ
こではこれを同時性原理と呼ぶことにする、を用いる。
この原理に基づいて情報統合が行われるが、移動空間の
座標系を獲得する方法としてはプロトタイプを用いた補
間計算が採用される。
【0176】図23において情報統合部16は、回帰情
報処理部12から回帰情報、感覚情報処理部14から感
覚情報をステップS21で入力として受け取る。これら
の情報は同時刻に抽出されたものである。回帰情報処理
部12からの回帰ベクトル信号(回帰情報)は、図24
において無条件刺激として4つの入力素子に与えられ
る。この入力信号と出力素子との間の入力荷重は固定さ
れている。また感覚情報処理部14からの符号化された
感覚信号としてのプロトタイプ(と感覚信号との距離に
応じた)信号は、条件刺激として9つの入力素子に与え
られる。これらの入力素子の数は、回帰情報処理部12
および感覚情報処理部14の出力素子の数にそれぞれ対
応する。感覚情報処理部14からの信号が入力される9
つの入力素子と出力素子との間の入力荷重は可変とさ
れ、この荷重は学習によって更新される。各出力素子は
線形出力特性を持つものとする。
【0177】ここで無条件刺激、条件刺激という用語
は、1960年代にGrossberg が学習によって特定の刺
激に対して一定の反応をする生物の行動をニューラルネ
ットを使ったモデルによって構成した時に使用した用語
であり、心理学や生理学においては普通に用いられてい
るものである。
【0178】条件付け学習モデルにおいては、無条件刺
激は定常的にニューラルネットに入力されている信号で
あり、無条件刺激だけではニューラルネットの学習は行
われない。条件刺激が入力されて初めてネットワークが
活性化し、ニューラルネットの学習が行われる。条件刺
激の大きさによってニューラルネットの活性状態が様々
に決まり、その時の状態にあわせて無条件刺激がニュー
ラルネットの荷重として学習される。
【0179】図23のステップS22で条件刺激の強度
に応じて強化荷重が決定される。後述するように本実施
例では条件刺激、すなわちプロトタイプ信号のうちで最
大の値を持つ信号が入力される入力素子に対応する結合
荷重、すなわち結合荷重列が強化荷重として決定され、
ステップS23でその強化荷重に対応する学習信号が無
条件刺激、すなわち回帰ベクトル信号に応じて生成さ
れ、Grossberg 型の学習における学習信号として用いら
れる。この学習については更に後述する。
【0180】そしてステップS24で、回帰ベクトルの
プロトタイプ(に相当する)行列の列毎の修正として、
感覚情報処理部14からの信号が入力される入力素子に
対応する結合荷重が列を単位として修正され、その結合
荷重列が感覚信号のプロトタイプに対応した回帰ベクト
ルを表現するように結合荷重の更新が行われ、感覚信号
プロトタイプに対応した回帰ベクトルの情報が、荷重と
してネットワークに埋め込まれることになる。
【0181】その後ステップS25で学習結果の評価と
して、例えば学習スケジュールが評価され、学習回数が
上限値を越えている場合には学習が停止され、越えてい
ない場合にはステップS26で次の信号の入力待ちとな
り、ステップS21以降の処理が繰り返される。
【0182】図25は、情報統合部の学習によってニュ
ーラルネットに埋め込まれる感覚信号プロトタイプと、
回帰ベクトルの対応関係の説明図である。図19で説明
したように、学習が終了した時点で感覚情報処理部14
のニューラルネットには感覚信号曲面プロトタイプに対
応する荷重が埋め込まれ、感覚情報処理部14はプロト
タイプと入力信号との距離に応じた値を出力することに
なる。この感覚信号プロトタイプとロボットの移動空間
内の点はユニークに対応し、対応する点の回帰ベクトル
の原点が決まればその座標はユニークに決定される。
【0183】ロボットによって自律的に獲得されるプロ
トタイプがどの回帰ベクトルに対応するかは、情報統合
部16の学習が行われるまでは不明である。しかしなが
らロボットが空間を探索している間に感覚信号プロトタ
イプを条件刺激、回帰ベクトルを無条件刺激としてGros
sberg 型の学習を行えば、図25に示される対応付けの
関係が自律的にニューラルネットの内部に埋めこまれる
ことになる。
【0184】情報統合部16における条件学習アルゴリ
ズムについて更に説明する。情報統合部16におけるニ
ューラルネットは、符号化された回帰ベクトルの次元と
等しい数の出力素子を持つ。このニューラルネットに入
力される条件刺激としての符号化された感覚信号↓y
(t) 、および無条件刺激としての回帰ベクトル↓h(t)
はそれぞれ次式によって与えられるものとする。
【0185】
【数46】
【0186】学習のスケジューリング関数は単調増加関
数であり、次式で与えられる。
【0187】
【数47】
【0188】このスケジューリング関数に対する閾値D
は正であり、学習回数の上限はtma x であり、学習定数
aは次の範囲を持つ、なおμ(t) は学習開始を制御する
ものであり、その値がDを越えたときに学習が開始され
る。
【0189】0<a≪1 ニューラルネットの出力は、感覚信号のプロトタイプに
ユニークに対応する回帰ベクトルのプロトタイプ{↓v
1 ,・・・↓vM }となる。情報統合部16における条
件学習は、次の(1) 〜(7) の手順によって行われる。 (1) ネットワークの初期化、各(出力)素子は識別子i
=1,2,・・・,Nにより区別される。ランダムな微
小値を選択することで各素子の条件入力荷重ベクトル↓
i (0) ,(i=1,2,・・・,N)を初期化する。 (2) t←1として学習を開始する。 (3) μ(t) >Dであれば(4) を実行、さもなければ(7)
にジャンプする。 (4) 条件刺激↓y(t) と無条件刺激↓h(t) を読み込
む。 (5) 条件刺激の最大要素yjmax (t) のインデックスj
max を検出する。 (6) Grossberg の学習ルール:
【0190】
【数48】
【0191】を適用して、各素子i(i=1,2,・・
・,N)の入力荷重のjmax 成分を更新する。uil(l
≠jmax )成分は更新しない。 (7) t←t+1.t>tmax であれば終了。さもなけれ
ば(3) に戻る。
【0192】次に情報統合部16の実行モードの動作に
ついて説明する。学習が終了した情報統合部16は、実
行モードにおいて、センサ信号に対応して感覚情報処理
部14から出力される感覚情報に基づいて、その感覚情
報に対応する感覚信号空間の曲面上の点とロボットの移
動空間上における点との対応関係によって、任意の点の
回帰ベクトルを出力する。この回帰情報の出力に際して
は、補間を用いて処理を実行する。
【0193】この補間においては、本実施例ではプロト
タイプに基づく凸包を用いることにし、ラジアルベース
関数による近似を行う。このラジアルベース関数による
近似については次の文献がある。 文献7:M.T.Musavi他:On the Training of Radial Ba
sis Function Classifiers, Neural Networks, Vol.4,
pp.593〜603(1992) この凸包を用いた処理においては、感覚情報処理部14
における各プロトタイプに対応する出力素子にガウス型
の受容野を設定し、感覚信号↓xとプロトタイプとの距
離に応じた重みの計算を次式によって行う。
【0194】
【数49】
【0195】情報統合部16では、感覚信号の各プロト
タイプに対応する回帰ベクトルがニューラルネットの荷
重として保存されているので、上式の重みに従って次の
凸包を求めることにより、入力信号に対応した回帰情報
の近似を行う。
【0196】
【数50】
【0197】これらの式により、信号空間において滑ら
かな近似を実現することができる。ここで下の式のV
(i0 )は感覚信号の最近接プロトタイプ↓wi0の近傍
を示す。すなわち近傍情報を用いた近似により、補間計
算の高速化が図られる。
【0198】図26は情報統合部16の実行モードにお
ける処理の説明図である。同図において、感覚情報の入
力に対応してステップS30で回帰ベクトルのプロトタ
イプ行列の各列毎の重みとしてその感覚情報を受け取
り、ステップS31で回帰ベクトルのプロトタイプの呼
び出しとして回帰ベクトルのプロトタイプが想起され、
ステップS32で回帰ベクトルの補間として凸包が計算
され、回帰情報が出力される。これらの一連の処理はニ
ューラルネットによって一度に実行される。
【0199】図27は情報統合部16のニューラルネッ
トによる実現方式の実行モードの説明図である。実行モ
ードにおいては、感覚情報処理部14から符号化された
感覚信号、すなわちプロトタイプ信号が入力され、ニュ
ーラルネットでは学習の結果固定された入力荷重を用い
て、出力素子がこの感覚信号に対応する回帰ベクトルを
想起し、その結果をロボットの駆動制御装置に与える。
【0200】以上をまとめると、情報統合部16は、量
子化された感覚信号空間において分割された各領域の代
表点に対応する移動空間内の代表点に対する回帰情報、
すなわち回帰ベクトルを基底として、移動空間内の任意
の位置における感覚情報、すなわち移動体を取り巻く環
境の観測結果に基づいて求められる感覚信号と前述の分
割された各領域の代表点との間の距離に対応する値を、
基底に対する重みとして用いて、任意の位置に対する回
帰ベクトルを補間によって求めることになる。
【0201】このように情報統合部16によって、感覚
情報処理部14から出力される符号化された感覚信号、
すなわちプロトタイプ信号(センサリープロトタイプ、
SP)から回帰ベクトル(ホーミングベクトル、HV)
が想起されるが、この想起された回帰ベクトルはロボッ
トの駆動制御装置15に与えられ、ロボットによる座標
系の形成と自己の位置決めを可能とする。そこで回帰ベ
クトルを用いて、ロボットが任意の地点から原点まで回
帰する場合の、回帰経路の生成について説明する。
【0202】図28(a) は情報統合部16が回帰ベクト
ルの想起を繰り返し、ロボットは少しづつ原点に近づく
場合の説明図である。ロボットは環境を探索し、任意の
地点から原点まで回帰するために必要な制御情報を逐次
生成して、原点に近づいていく。この回帰行動における
回帰ベクトルの想起の繰り返し回数をtとすると、回帰
行動は次の(1) 〜(5) の手順を用いて実行される。 (1) 情報統合部においてSP→HV想起による現地点の
回帰ベクトル↓h(t) が想起される。 (2) 想起された回帰ベクトルの最大値要素himax (t)
担う素子imax を検出する。 (3) himax (t) がある小さな値以下であれば停止する。
さもなければ(4) を実行する。 (4) 移動体をφ(t) =(2π/N)imax 方向にu(t)
=c(t) ‖↓h(t) ‖だけ移動する。ここで0<c(t)
<1はtの単調減少函数である。 (5) t←t+1として(1) に戻る。
【0203】このようにして生成された制御情報、すな
わち距離を示すu(t) 、および方位φ(t) に従って、ロ
ボットは回帰ベクトルを逐次想起しながら、原点との距
離を詰めていくことになる。
【0204】これに対して図28(b) は、任意の地点に
おいて原点までの回帰のために必要な制御情報を一括し
て求める場合の説明図である。このように1回で原点ま
で回帰する場合の回帰行動は、次の手順(1) 〜(4) によ
って行われる。 (1) 任意地点における回帰ベクトル↓hをSP→HV想
起により生成する。 (2) ↓hの最大要素を担う素子imax を検出する。 (3) 回帰ベクトルから原点の方向
【0205】
【数51】
【0206】と原点までの距離
【0207】
【数52】
【0208】を計算する。 (4) 移動体はφ方向に距離uだけ移動して停止する。 ここで(3) における原点の方向としての角度φの計算法
について説明する。回帰ベクトル(h1 ,・・・,
N )の各要素のうちで最大値を持つ要素のインデック
スをimax とする。この最大値要素himaxと、最大値要
素に隣接した成分h imax+1を使って、原点の方向φを求
める。一般には最大値要素と隣接した要素を使うだけで
なく、異なる2つの成分を利用することによりφを求め
ることができるが、計算式が面倒になる。
【0209】最大要素とそれに隣接した要素は
【0210】
【数53】
【0211】と書ける。更にhimax+1を加法定理によっ
て展開した形式で書くと、
【0212】
【数54】
【0213】となる。この式の両辺を最大要素で割ると
【0214】
【数55】
【0215】が得られる。この式をφについて整理する
と、
【0216】
【数56】
【0217】となる。ただし、imax =Nの場合にはi
max +1として“1”を用いるものとする。次に図2の
情報統合部16による回帰情報をキーとする感覚信号の
想起について説明する。回帰ベクトル、すなわちHVか
ら感覚のプロトタイプ信号、すなわちSPを想起する機
能は、回帰ベクトルに基づいて獲得された座標系に基づ
いた高次の機能を実現する際に利用できる。例えばHV
からSPを想起する機能によって、原点に対するロボッ
ト現在位置の相対位置から障害物の情報を想起して、あ
らかじめ障害物を避けるような運動制御の信号列を作り
出す時に利用される。
【0218】またHVからSPを想起する機能は、より
プリミティブなレベルとして、回帰ベクトルの計算にお
ける誤差蓄積の補正に使えると考えられる。例えば運動
情報を積算して得られている回ベクトル信号↓h′(t)
から感覚信号のプロトタイプ↓s′(t) を想起して、実
際に感覚センサ信号から計算されたプロトタイプ↓s
(t) と比較し、両者の間の誤差が大きい場合には↓s
(t) をキーとして想起される回帰ベクトル↓h(t) を用
いて↓h′(t) の置き換えを行うことによって、補正が
行われる。しかしながらこの方式では、想起する回帰ベ
クトルには誤差がないことが要求される。
【0219】情報統合部16による、回帰ベクトルから
感覚のプロトタイプ信号を想起する動作について、図2
9〜図32を用いて説明する。図29はHVからSPを
想起する動作を実現するための学習モードにおける処理
の説明図、図30は学習モードにおける情報統合部16
のニューラルネットによる実現方式の説明図である。
【0220】図29の学習モードにおいては、図30の
ニューラルネットに回帰ベクトル信号とプロトタイプ信
号とが同時に入力され、回帰ベクトル信号をキーとし
て、出力層のニューロンがプロトタイプ信号と同じ出力
パターンを出力するように学習が行われる。この学習は
教師付学習のように見えるが、情報統合部16のHVか
らSPを想起する部分に対する教師信号をシステムが作
り出しており、この教師信号に対応する感覚プロトタイ
プ信号を生成するニューラルネットワークが自己組織的
に構成されることを考えると、システム全体としては自
己組織型と考えられる。
【0221】図30において、回帰ベクトル信号が入力
される部分におけるニューラルネットの荷重は可変であ
るが、感覚プロトタイプ信号が入力される部分の荷重は
固定である。
【0222】図29において、まずステップS34で回
帰ベクトル信号と感覚のプロトタイプ信号との入力が行
われ、ステップS35で感覚のプロトタイプ信号の強度
パターンに応じて、ニューラルネット内の出力素子に対
する入力荷重の変更の度合いが決められる。基本的には
コホーネン型の学習ルールを適用して回帰ベクトル信号
空間のプロトタイピングが行われる。最も強く発火する
ニューロンを感覚のプロトタイプ信号で決定し、そのニ
ューロンに対応する入力荷重の更新が行われる。これに
よって感覚のプロトタイプ信号パターンとニューラルネ
ットの出力パターンを一致させることができる。
【0223】ステップS36で回帰ベクトルと入力荷重
との差の評価が行われ、ステップS37で学習信号、す
なわち入力荷重の更新量が生成され、ステップS38で
その学習信号に基づいて入力荷重の更新が行われる。
【0224】回帰ベクトル信号はN次元の信号
1 (t) ,・・・,hN (t) であり、感覚プロトタイプ
信号はM次元の信号y1 (t) ,・・・,yM (t) であ
る。出力素子はガウス型の受容野を持つニューロンであ
り、その素子数は感覚信号プロトタイプを生成するニュ
ーラルネットと同じである。学習回数tにおける出力層
のi番目のニューロンのj番目の入力荷重wij (t) (i
=1,2,・・・,M、j=1,2,・・・,N)は、
次の学習ルールを用いて更新される。
【0225】
【数57】
【0226】ステップS39で学習スケジュールの評価
が行われ、適当な回数だけ学習が行われた後に学習は停
止される。その回数だけ未だ学習が行われていない場合
には、ステップS40で信号入力待ちとなり、信号入力
に対応してステップS34以降の処理が繰り返される。
【0227】図30において斜線で塗られた円は入力層
ニューロンを表し、ここから回帰ベクトル信号と感覚の
プロトタイプ信号が入力される。白抜きの大きな円が感
覚のプロトタイプ信号を想起する出力素子を表し、その
個数は感覚のプロトタイプ信号の次元と同じである。灰
色の小さな円は回帰ベクトル信号に対する出力素子の入
力荷重を表し、その値は可変である。黒く塗りつぶされ
た小さな円は感覚のプロトタイプ信号に対する入力荷重
を表し、その値は固定である。
【0228】情報統合部16における学習処理は、学習
回数の上限をtmax 、学習のスケジュール関数を単調減
少関数μ(t) として行われる。スケジュールの定数の間
には次の関係がある。
【0229】μ1 >μ2 >0 学習処理は次の手順(1) 〜(6) に従って行われる。 (1) ネットワークの初期化、各(出力)素子は識別子i
=1,2,・・・,Mにより区別される。ランダムな微
小値を選択することで各素子の入力荷重↓wi (0 ) (i
=1,2,・・・,M)を初期化する。 (2) t←1として学習を開始する。 (3) 回帰ベクトル信号↓h(t) と感覚のプロトタイプ信
号↓y(t) を読み込む。 (4) 感覚のプロトタイプ信号↓y(t) の各要素の強さに
応じて、回帰ベクトル↓h(t) と各入力荷重との差に基
づいて学習信号を生成する。
【0230】
【数58】
【0231】(5) Δ↓wi (t) =(Δwi1 (t) ,Δwi2
(t) ,・・・,ΔwiN (t) ),(i=1,2,・・・,
M)として各ニューロンの入力荷重↓wi (t) =(wi1
(t) ,・・・,wiN (t) )の修正を行う。
【0232】↓wi (t+1) =↓wi (t) +Δ↓wi (t)
(i=1,2,・・・,M) (6) t←t+1.t>tmax であれば学習を終了する。
さもなければ(3) に戻る。
【0233】図31は情報統合部16におけるHVから
SPを想起する動作の実行モードにおける処理の説明
図、図32はこの処理に用いられる情報統合部16のニ
ューラルネットによる実現方式の説明図である。実行モ
ードでは、学習終了後にHVからSPを想起するため
に、感覚のプロトタイプ信号が入力される素子に対応す
る入力荷重が0とされ、学習で得られた回帰ベクトルが
入力される素子に対応する荷重が固定化された後に、図
31の処理が行われる。すなわち回帰ベクトルが入力さ
れると、ステップS42でその回帰ベクトルと、学習に
よって得られたプロトタイプ、すなわち入力荷重の値と
の距離が評価され、ステップS43で距離の評価に基づ
いて感覚信号のプロトタイプが計算され、その結果が感
覚のプロトタイプ信号の想起結果として出力される。
【0234】図32で出力層のニューロンの出力は、感
覚信号空間のプロトタイプに対応する回帰ベクトル信号
のプロトタイプを中心とするガウス型の受容野を持つ関
数である。具体的には、出力層のi番目のニューロンに
対する入力荷重を↓wi =(wi 1 ,・・・wiN)と
し、回帰ベクトル信号を↓h=(h1 ,・・・,hN
とすると、ニューロンの出力は次式によって与えられ
る。
【0235】
【数59】
【0236】これによって、回帰ベクトル信号に対応し
た感覚信号のプロトタイプが出力層ニューロンから出力
されるようになる。ニューロンの出力の式における分散
σiの値は、感覚信号のプロトタイプを生成するニュー
ロン、すなわち図22の出力素子に対応する分散の定数
倍(d倍)とする。入力荷重の学習の後に感覚情報処理
部14から出力される感覚のプロトタイプ信号と、図3
2において想起されるプロトタイプ信号との誤差が最小
になるようにdの値が決められる。
【0237】以上をまとめると、量子化された感覚信号
空間において分割された各領域の代表点と、回帰情報空
間内の代表点に対応する移動空間内の代表点に対する感
覚信号との間の距離に応じた値としての感覚情報、すな
わち回帰情報空間内の代表点に対応する感覚情報を基底
として、移動空間内の任意の点に対する回帰情報を重み
として用いて、任意の点に対応する感覚情報、すなわち
プロトタイプ信号を補間によって求めることになる。
【0238】最後にロボットの回帰ナビゲーション(シ
ミュレーション)について説明する。この回帰ナビゲー
ションにおいては、ロボットは最初回帰行動の原点、す
なわち任意のホームポジションに設置された後、ロボッ
トは一定時間空間を探索し、回帰情報および感覚情報を
基に空間の様子を把握し、その後ロボットは任意の地点
に置かれ、原点に正確に回帰することができるかどうか
が調べられた。原点の場所や移動空間の領域の大きさは
ロボットに対しては与えられていない。
【0239】図33はロボットと外界のセンサ信号との
関係の説明図である。ロボットは、例えば一辺がおよそ
2mの正方形に区切られた移動空間内を動くものとす
る。センサとして超音波センサなどを用いるものとすれ
ば、障害物からの距離に比例した信号がセンサ信号とし
て与えられる。このセンサ信号は移動空間の外側に配置
された手掛かり刺激と見なすことができる。簡単のた
め、センサ信号はロボットの車体の方向には依存しない
値として得られるものとする。例えば全ての方位に対し
てセンサを備える場合には、全ての方位のランドマーク
からの距離情報を利用できることと同じになる。
【0240】図33において、ロボットは移動空間内に
おいてランダムウォークを行いながら運動情報を積算し
て回帰ベクトルを逐次計算し、かつ感覚信号を収集す
る。その間に感覚信号空間のプロトタイプを自己組織的
に形成し、移動空間に対応する感覚信号マップを獲得す
る。また同時性原理に従って、感覚情報と回帰情報とを
自己組織的な学習によって統合する。
【0241】図34は学習終了後のロボットの位置決め
の説明図である。回帰情報と感覚情報とを統合すること
によって、すでに移動空間に対応する感覚信号空間上に
おいて回帰ベクトルを想起することが可能となってい
る。従って感覚信号をキーとして、任意の点におけるロ
ボットの位置情報である回帰ベクトルを求めることがで
き、複数個の回帰ベクトルを用いることにより、原点の
位置に対する空間点の相対位置を決めることができ、自
律的に移動空間内の座標系を獲得することができる。
【0242】本ナビゲーションにおいては、回帰情報処
理部としては図10に説明したニューラルネットと同様
のものを用いることができるが、すでに出願人の先願
(文献2)においてベクトル演算装置としてその概要が
すでに与えられている。
【0243】回帰情報処理部12は1つの運動経路に対
して運動信号を積算し、回帰情報を31次元のコサイン
ベクトルとして情報統合部16に提供する。感覚情報処
理部14と情報統合部16とは前述のようなニューラル
ネットワークによって構成される。感覚情報処理部14
は25個のニューロンを用いて感覚信号空間を分割する
プロトタイプを表現する。その出力はプロトタイプとセ
ンサ信号との距離の関数(ガウス関数)とする。
【0244】情報統合部16は31個のニューロンを用
いて学習によって回帰情報を表現する。各ニューロンの
入力荷重は回帰情報信号に対応するプロトタイプとして
機能する。空間探索においてランダムウォークによって
移動空間を移動し、移動空間全体を被覆するような経路
上でロボットは回帰情報および感覚情報を生成し、感覚
情報処理部14および情報統合部16においてオンライ
ン処理として逐次的に入力される信号に基づいて必要な
学習を行う。
【0245】回帰シミュレーションの結果を図35〜図
37を用いて説明する。このシミュレーション結果は、
回帰情報と感覚情報とを一対とした学習サンプル10,000
個を用いた場合の結果である。この学習は学習モードに
おいてオンライン処理によって行われた。オンライン処
理というのは機械学習理論の方面でよく使われる言葉で
ある。オンライン処理の学習では、1個のサンプルの入
力に対応して学習ルールを適用し、逐次的にネットワー
クの荷重を更新する形式で学習が行われる。オンライン
処理と異なる学習形式として、バッジ処理がある。バッ
ジ処理では、サンプルの集合全体に対して線形、もしく
は非線形最適化法が適用され、最適な仮説か一度に選択
されるような形式で学習が行われる。
【0246】感覚情報処理部14におけるプロトタイプ
生成と、情報統合部16における回帰情報と感覚情報の
統合において、それぞれの学習ルールが一対の入力に対
して1回適用される。
【0247】図35は学習によって情報統合部16にお
いて回帰情報と感覚情報が統合され、感覚信号空間のプ
ロトタイプに対応して形成された回帰ベクトル場を示
す。図において黒丸は格子点を、矢印は回ベクトルを示
す。
【0248】図36は図35に示したようなベクトル場
を基にして、任意の地点から原点に回帰した時の誤差を
示す。素子の数と学習回数が少ないためにある程度の誤
差が生じているが、ほぼ同程度の誤差で、滑らかに移動
空間としての座標系が再現されていることが分かる。
【0249】図37は適当な任意の4地点P1〜P4を
選んで、具体的に想起された回帰情報と正確な回帰情報
との比較結果である。図で破線が正確な回帰情報を示
し、実線は本シミュレーションにおけるロボットの動き
を示す。これによって本発明の学習型自己定位装置が自
律的に自己の位置情報を計算しているということが示さ
れている。
【0250】
【発明の効果】以上詳細に説明したように、本発明によ
れば移動体の運動情報を経路に従って積算した結果とし
ての回帰情報と、移動体の環境の状況を示すセンサ信号
などに基づく感覚情報とを統合することにより、移動体
の位置決めを自律的に行うことが可能となる。従来の通
常の三角測量法などでは、信号空間の符号化と、符号化
された空間に位相、すなわち距離を導入することが一度
に行われ、それらを結びつけるのはシステムの設計者の
役割であったが、の学習型定位装置を用いることによっ
て、そのような作業をシステムの設計者から切り離し、
移動体自体がそのような作業を自律的に遂行することが
可能となり、移動体の運動の自律化を達成するために寄
与するところが大きい。
【図面の簡単な説明】
【図1】本発明の学習型自己定位装置の原理構成を示す
ブロック図である。
【図2】本発明の学習型自己定位装置の全体構成を示す
ブロック図である。
【図3】相対方位を用いた回帰情報の更新を説明する図
である。
【図4】回帰情報処理部による処理の説明図である。
【図5】方位角を離散ガウス信号に変換するニューラル
ネットの例を示す図である。
【図6】図5のニューラルネットの4つのニューロンの
出力を示す図である。
【図7】4つのニューロンの出力強度比率を示す図(θ
=4π/5)である。
【図8】方位角のレンジを12個のニューロンで分割し
たときの出力を示す図である。
【図9】図8におけるニューロンの出力強度比率を示す
図(θ=4π/5)である。
【図10】回帰情報処理部のニューラルネットによる実
現方式を示す図である。
【図11】感覚情報処理部の学習モードにおける処理の
説明図である。
【図12】符号化されたフィルタの出力信号を示す図で
ある。
【図13】超音波センサが障害物までの距離を測定して
いる状況の説明図である。
【図14】超音波センサ信号を次元拡大するニューラル
ネットの説明図である。
【図15】図14のニューラルネットの各ニューロンの
出力強度を示す図である。
【図16】図14のニューラルネットの出力パターンを
示す図である。
【図17】各センサに対応する障害物との距離および各
ニューロンの出力強度を示す図である。
【図18】学習モードにおける感覚情報処理部のニュー
ラルネットによる実現方式を示す図である。
【図19】感覚信号のプロトタイプ形成過程の説明図で
ある。
【図20】荷重修正時における全順序の使用の効果を説
明する図である。
【図21】実行モードにおける感覚情報処理部の処理の
説明図である。
【図22】実行モードにおける感覚情報処理部のニュー
ラルネットによる実現方式を示す図である。
【図23】情報統合部の学習モードにおける処理の説明
図である。
【図24】学習モードにおける情報統合部のニューラル
ネットによる実現方式を示す図である。
【図25】感覚信号プロトタイプと回帰ベクトルの対応
関係の説明図である。
【図26】実行モードにおける情報統合部の処理の説明
図である。
【図27】実行モードにおける情報統合部のニューラル
ネットによる実現方式を示す図である。
【図28】 想起された回帰ベクトルを用いて移動体が
原点まで回帰する例の説明図である。
【図29】情報統合部において回帰ベクトルから感覚プ
ロトタイプ信号を想起するための学習処理の説明図であ
る。
【図30】図29の学習処理を実行するための情報統合
部のニューラルネットによる実現方式を示す図である。
【図31】情報統合部において回帰ベクトルから感覚プ
ロトタイプ信号を想起する実行モードの処理の説明図で
ある。
【図32】図31の実行モードにおける情報統合部のニ
ューラルネットによる実現方式を示す図である。
【図33】回帰ナビゲーションにおけるロボットと外界
のセンサ信号との関係の説明図である。
【図34】学習終了後のロボットの位置決めの説明図で
ある。
【図35】情報統合部の統合結果としての回帰ベクトル
場を示す図である。
【図36】任意の地点から原点への回帰誤差を示す図で
ある。
【図37】4つの地点に対する正しい回帰情報とロボッ
トの動きの比較を示す図である。
【符号の説明】
1 回帰情報処理手段 2 感覚情報処理手段 3 情報統合手段 10 学習型自己定位装置 11,13 センサ 12 回帰情報処理部 14 感覚情報処理部 15 駆動制御装置 16 情報統合部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 移動体が移動空間内における自己の位置
    を定位するための自己定位装置において、 該移動空間における移動体の原点からの相対位置に対応
    する回帰情報を求める回帰情報処理手段と、 該移動体の該相対位置における環境状況に対応する感覚
    情報を求める感覚情報処理手段と、 該回帰情報と感覚情報との相関を学習して該2つの情報
    を統合した後に、感覚情報処理手段から入力される感覚
    情報に対応する回帰情報を想起して出力する情報統合手
    段とを備え、移動体が自律的に自己の位置を定位可能と
    することを特徴とする学習型自己定位装置。
  2. 【請求項2】 前記回帰情報処理手段が、移動体の運動
    状態を示す運動信号を逐次積算して、該移動体の移動経
    路上で前記回帰情報を求めることを特徴とする請求項1
    記載の学習型自己定位装置。
  3. 【請求項3】 前記回帰情報処理手段が、移動体の原点
    からの距離と方向を示すセンサ信号の入力に対して、該
    センサ信号を離散・局在化させた信号を前記運動信号と
    して逐次積算することを特徴とする請求項2記載の学習
    型自己定位装置。
  4. 【請求項4】 前記感覚情報処理手段が、移動空間内の
    任意の位置において、移動体を取り巻く環境の観測結果
    に基づいて求められる感覚信号と、量子化された感覚信
    号空間において分割された各領域の代表点との間の距離
    に対応する値を前記感覚情報として前記情報統合手段に
    出力することを特徴とする請求項1記載の学習型自己定
    位装置。
  5. 【請求項5】 前記感覚情報処理手段が、前記環境状況
    を示すセンサ信号の入力に対して、該センサ信号を離散
    ・局在化させた信号を前記感覚信号とすることを特徴と
    する請求項4記載の学習型自己定位装置。
  6. 【請求項6】 前記感覚情報処理手段が、自己組織的に
    学習を行うニューラルネットによって構成されること
    と、 該ニューラルネットが移動空間内の代表点に対応する前
    記感覚信号のベクトルと、該ニューラルネットの出力層
    ニューロンへの結合荷重のベクトルとの距離のうちで最
    も該距離が小さい結合荷重のベクトルの更新量を最大と
    する学習を行った後に、前記任意の位置における感覚情
    報を前記情報統合手段に出力することを特徴とする請求
    項4記載の学習型自己定位装置。
  7. 【請求項7】 前記情報統合手段が、前記学習における
    2つの情報の統合に際して、移動空間内の任意の点に対
    する前記感覚信号と、前記分割された各領域の代表点と
    の各距離に対応するそれぞれの値としての感覚情報の入
    力に対して、該情報統合手段の内部で該それぞれの値の
    うちの最大値が入力される結合の荷重として、該任意の
    点に対応する回帰情報の値を学習することを特徴とする
    請求項4記載の学習型自己定位装置。
  8. 【請求項8】 前記情報統合手段が、前記分割された各
    領域の代表点に対応する移動空間内の代表点に対する前
    記回帰情報を基底として、移動空間内の任意の位置にお
    ける前記感覚情報を該基底に対する重みとして用いて、
    該任意の位置に対応する回帰情報を補間によって求める
    ことを特徴とする請求項4記載の学習型自己定位装置。
  9. 【請求項9】 移動体が移動空間内における自己の位置
    を定位するための自己定位装置において、 移動空間における移動体の原点からの相対位置に対応す
    る回帰情報を求める回帰情報処理手段と、 該移動体の該相対位置における環境状況に対応する感覚
    情報を求める感覚情報処理手段と、 該回帰情報と感覚情報との相関の学習において、該2つ
    の情報を統合した後に、回帰情報処理手段から入力され
    る回帰情報に対応する感覚情報を想起して出力する情報
    統合手段とを備えたことを特徴とする学習型自己定位装
    置。
  10. 【請求項10】 前記情報統合手段が、回帰情報空間内
    の代表点に対応する感覚情報であって、量子化された感
    覚信号空間において分割された各領域の代表点と、該回
    帰情報空間内の代表点に対応する移動空間内の代表点に
    対する感覚信号との間の距離に応じた値としての感覚情
    報を基底とし、移動空間内の任意の点に対する回帰情報
    を重みとして用いて、該任意の点に対応する感覚情報を
    補間によって求めることを特徴とする請求項9記載の学
    習型自己定位装置。
  11. 【請求項11】 移動体が移動空間内における自己の位
    置を定位するための自己定位方法において、 移動空間内における移動体の原点からの相対位置を示す
    回帰情報を求め、 該移動体の該相対位置における環境状況を示す感覚情報
    を求め、 該回帰情報と感覚情報との相関の学習において該2つの
    情報を統合し、 移動空間内の任意の位置に対する感覚情報に対応する回
    帰情報を想起して出力し、 移動体が自律的に自己の位置を定位可能とすることを特
    徴とする学習型自己定位方法。
  12. 【請求項12】 移動体が移動空間内における自己の位
    置を定位するための自己定位方法において、 移動空間内における移動体の原点からの相対位置を示す
    回帰情報を求め、 該移動体の該相対位置における環境状況を示す感覚情報
    を求め、 該回帰情報と感覚情報との相関の学習において該2つの
    情報を統合し、 移動空間内の任意の位置に対する回帰情報に対応する感
    覚情報を想起して出力することを特徴とする学習型自己
    定位方法。
JP34770596A 1996-12-26 1996-12-26 学習型自己定位装置 Expired - Fee Related JP3647584B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP34770596A JP3647584B2 (ja) 1996-12-26 1996-12-26 学習型自己定位装置
US08/909,945 US6018696A (en) 1996-12-26 1997-08-12 Learning type position determining device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34770596A JP3647584B2 (ja) 1996-12-26 1996-12-26 学習型自己定位装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2004290821A Division JP2005100421A (ja) 2004-10-01 2004-10-01 学習型自己定位装置

Publications (2)

Publication Number Publication Date
JPH10185589A true JPH10185589A (ja) 1998-07-14
JP3647584B2 JP3647584B2 (ja) 2005-05-11

Family

ID=18392029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34770596A Expired - Fee Related JP3647584B2 (ja) 1996-12-26 1996-12-26 学習型自己定位装置

Country Status (2)

Country Link
US (1) US6018696A (ja)
JP (1) JP3647584B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222223A (ja) * 2014-05-23 2015-12-10 日産自動車株式会社 車両位置推定装置、及び車両位置推定方法
KR20180114723A (ko) * 2017-04-11 2018-10-19 현대자동차주식회사 차량 및 차량 후진 시 충돌방지 보조 방법
CN111366123A (zh) * 2020-03-06 2020-07-03 大连理工大学 一种基于多任务学习的零件表面粗糙度和刀具磨损预测方法

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5883817A (en) * 1996-07-08 1999-03-16 Trimble Navigation Limited Method and apparatus for precise positioning of large structures
US6941199B1 (en) * 1998-07-20 2005-09-06 The Procter & Gamble Company Robotic system
DE19949409A1 (de) * 1999-10-13 2001-04-19 Bosch Gmbh Robert Verfahren und Vorrichtung zur Objektdetektierung
US6374155B1 (en) * 1999-11-24 2002-04-16 Personal Robotics, Inc. Autonomous multi-platform robot system
JP2003133200A (ja) * 2001-10-19 2003-05-09 Canon Inc シミュレーション装置及びシミュレーション方法
US6965885B2 (en) * 2002-01-22 2005-11-15 Koninklijke Philips Electronics N.V. Self-organizing feature map with improved performance by non-monotonic variation of the learning rate
GB2405002A (en) * 2003-08-15 2005-02-16 Isis Innovation Three-dimensional modelling
JP4398430B2 (ja) * 2003-10-31 2010-01-13 富士通株式会社 距離算出装置および算出プログラム
US7400291B2 (en) * 2003-12-04 2008-07-15 Sony Corporation Local positioning system which operates based on reflected wireless signals
US20060087425A1 (en) * 2004-07-12 2006-04-27 William Marsh University System and method for localization over a wireless network
KR100626539B1 (ko) * 2004-08-17 2006-09-20 엘지전자 주식회사 네비게이션 시스템에서 이동체의 방위각 보정방법
US7937197B2 (en) * 2005-01-07 2011-05-03 GM Global Technology Operations LLC Apparatus and methods for evaluating a dynamic system
US7541923B2 (en) * 2005-01-12 2009-06-02 Industrial Technology Research Institute Method for and system of intrusion detection by using ultrasonic signals
DE102006014546B4 (de) * 2006-03-21 2010-08-19 Universität Tübingen Verfahren und Vorrichtung zum sensorbasierten Überwachen einer Umgebung
US8648867B2 (en) 2006-09-25 2014-02-11 Neurala Llc Graphic processor based accelerator system and method
US8868288B2 (en) * 2006-11-09 2014-10-21 Smartdrive Systems, Inc. Vehicle exception event management systems
JP4517107B2 (ja) * 2006-11-22 2010-08-04 国立大学法人東京海洋大学 重心検知装置および横転限界速度予測装置並びに貨物重量予測装置並びに演算プログラム
KR101469246B1 (ko) * 2007-08-07 2014-12-12 삼성전자주식회사 로봇에서 사진 촬영하는 장치 및 방법
US9424513B2 (en) 2011-11-09 2016-08-23 Qualcomm Incorporated Methods and apparatus for neural component memory transfer of a referenced pattern by including neurons to output a pattern substantially the same as the referenced pattern
US9015091B2 (en) 2011-11-09 2015-04-21 Qualcomm Incorporated Methods and apparatus for unsupervised neural replay, learning refinement, association and memory transfer: structural plasticity and structural constraint modeling
US9443190B2 (en) 2011-11-09 2016-09-13 Qualcomm Incorporated Methods and apparatus for neural pattern sequence completion and neural pattern hierarchical replay by invoking replay of a referenced neural pattern
US9424511B2 (en) 2011-11-09 2016-08-23 Qualcomm Incorporated Methods and apparatus for unsupervised neural component replay by referencing a pattern in neuron outputs
US8694183B1 (en) * 2011-12-06 2014-04-08 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Partial automated alignment and integration system
WO2014204615A2 (en) 2013-05-22 2014-12-24 Neurala, Inc. Methods and apparatus for iterative nonspecific distributed runtime architecture and its application to cloud intelligence
EP2999940A4 (en) 2013-05-22 2017-11-15 Neurala Inc. Methods and apparatus for early sensory integration and robust acquisition of real world knowledge
US9610955B2 (en) 2013-11-11 2017-04-04 Smartdrive Systems, Inc. Vehicle fuel consumption monitor and feedback systems
US8892310B1 (en) 2014-02-21 2014-11-18 Smartdrive Systems, Inc. System and method to detect execution of driving maneuvers
EP3120300A4 (en) * 2014-03-19 2017-11-22 Neurala Inc. Methods and apparatus for autonomous robotic control
US9626566B2 (en) 2014-03-19 2017-04-18 Neurala, Inc. Methods and apparatus for autonomous robotic control
GB2538779B (en) * 2015-05-28 2017-08-30 Dyson Technology Ltd A method of controlling a mobile robot
KR20180070062A (ko) 2016-12-16 2018-06-26 삼성전자주식회사 이동체 및 이동체의 제어 방법
CN115855022A (zh) * 2017-04-07 2023-03-28 辉达公司 使用深度神经网络执行自主路径导航
US11393160B2 (en) * 2018-03-23 2022-07-19 Intel Corporation Deep geometric model fitting
CN109165472A (zh) * 2018-10-11 2019-01-08 北京航空航天大学 一种基于变拓扑自组织网络的电源健康评估方法
CN109631848B (zh) * 2018-12-14 2021-04-16 山东鲁能软件技术有限公司 输电线路异物入侵检测系统和检测方法
JP7188612B2 (ja) * 2019-10-02 2022-12-13 富士通株式会社 生成方法、生成プログラムおよび情報処理装置
US10732261B1 (en) 2019-12-31 2020-08-04 Aurora Innovation, Inc. Generating data using radar observation model based on machine learning
WO2023184223A1 (zh) * 2022-03-30 2023-10-05 中国电子科技集团公司信息科学研究院 基于脑启发空间编码机制的机器人自主定位方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2261292A (en) * 1991-06-21 1993-01-25 Unitech Research, Inc. Real time three dimensional geo-referenced digital orthophotograph-based positioning, navigation, collision avoidance and decision support system
US5548512A (en) * 1994-10-04 1996-08-20 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Autonomous navigation apparatus with neural network for a mobile vehicle

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015222223A (ja) * 2014-05-23 2015-12-10 日産自動車株式会社 車両位置推定装置、及び車両位置推定方法
KR20180114723A (ko) * 2017-04-11 2018-10-19 현대자동차주식회사 차량 및 차량 후진 시 충돌방지 보조 방법
CN111366123A (zh) * 2020-03-06 2020-07-03 大连理工大学 一种基于多任务学习的零件表面粗糙度和刀具磨损预测方法

Also Published As

Publication number Publication date
US6018696A (en) 2000-01-25
JP3647584B2 (ja) 2005-05-11

Similar Documents

Publication Publication Date Title
JP3647584B2 (ja) 学習型自己定位装置
JP6855524B2 (ja) 低速特徴からのメトリック表現の教師なし学習
Nubert et al. Self-supervised learning of lidar odometry for robotic applications
Rodić et al. Virtual WRSN—Modeling and simulation of wireless robot-sensor networked systems
Zhang et al. Beyond point clouds: Fisher information field for active visual localization
Samaniego et al. A bayesian optimization approach for water resources monitoring through an autonomous surface vehicle: The ypacarai lake case study
Mu et al. End-to-end navigation for autonomous underwater vehicle with hybrid recurrent neural networks
US20230243658A1 (en) Systems, Methods and Devices for Map-Based Object's Localization Deep Learning and Object's Motion Trajectories on Geospatial Maps Using Neural Network
Assad et al. Novel adaptive fuzzy extended Kalman filter for attitude estimation in GPS-denied environment
Nurmaini et al. Simple pyramid RAM-based neural network architecture for localization of swarm robots
Li et al. Inertial sensing meets artificial intelligence: Opportunity or challenge?
JP2005100421A (ja) 学習型自己定位装置
Guo et al. Intelligent assistance positioning methodology based on modified iSAM for AUV using low-cost sensors
Poddar et al. Tuning of GPS aided attitude estimation using evolutionary algorithms
Mombaur et al. An inverse optimal control approach to human motion modeling
Hata et al. Particle filter localization on continuous occupancy maps
Zhang et al. Mobile sensing and simultaneously node localization in wireless sensor networks for human motion tracking
Lenton et al. End-to-end egospheric spatial memory
Stanislav et al. Sensors data fusion via bayesian filter
Zha et al. Map-based temporally consistent geolocalization through learning motion trajectories
CN113743586B (zh) 一种基于海马空间认知机理的运行体自主定位方法
Lu et al. Biologically inspired visual odometry based on the computational model of grid cells for mobile robots
Uyulan et al. Mobile robot localization via sensor fusion algorithms
CN112198793B (zh) 基于认知网络的机器人避障方法
ADEBAYO et al. Natural navigation system design for indoor mobile robots

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040331

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041001

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20041006

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050209

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080218

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090218

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100218

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110218

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120218

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130218

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees