JPH076145A - 神経回路網型適応目標到達装置 - Google Patents
神経回路網型適応目標到達装置Info
- Publication number
- JPH076145A JPH076145A JP5144963A JP14496393A JPH076145A JP H076145 A JPH076145 A JP H076145A JP 5144963 A JP5144963 A JP 5144963A JP 14496393 A JP14496393 A JP 14496393A JP H076145 A JPH076145 A JP H076145A
- Authority
- JP
- Japan
- Prior art keywords
- function
- unit
- signal
- movement
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 23
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 12
- 230000006870 function Effects 0.000 claims abstract description 42
- 230000005540 biological transmission Effects 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000000034 method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Landscapes
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
(57)【要約】
【目的】 移動指標地図がなくても、移動指標地図を自
ら作成しながら目標に到達することができる神経回路網
型適応目標到達装置を提供する。 【構成】 信号受信部1から現在の状態に関する情報を
受け取るとともに、以前の状態、移動および信号の時間
変化を移動量によって正規化した値である報酬値の関数
を表す関数を学習処理部2において層構造の神経回路網
に学習させ、この学習された関数の勾配方向の要素を神
経回路網の出力層から入力層へ伝搬し、該関数の勾配方
向の要素に基づいて状態を示す入力ユニット以外の入力
ユニットの出力を変化させることを繰り返して、学習処
理部3で学習された関数の最大点を関数最大点探索部4
で求め、この関数の最大点を数値変換部5で移動に変換
し、この移動を動力伝達部6で行う。
ら作成しながら目標に到達することができる神経回路網
型適応目標到達装置を提供する。 【構成】 信号受信部1から現在の状態に関する情報を
受け取るとともに、以前の状態、移動および信号の時間
変化を移動量によって正規化した値である報酬値の関数
を表す関数を学習処理部2において層構造の神経回路網
に学習させ、この学習された関数の勾配方向の要素を神
経回路網の出力層から入力層へ伝搬し、該関数の勾配方
向の要素に基づいて状態を示す入力ユニット以外の入力
ユニットの出力を変化させることを繰り返して、学習処
理部3で学習された関数の最大点を関数最大点探索部4
で求め、この関数の最大点を数値変換部5で移動に変換
し、この移動を動力伝達部6で行う。
Description
【0001】
【産業上の利用分野】本発明は、神経回路網型自立移動
機械に関し、特に明示的な地図などを予め持ち合わせる
必要がない移動機械である神経回路網型適応目標到達装
置に関する。
機械に関し、特に明示的な地図などを予め持ち合わせる
必要がない移動機械である神経回路網型適応目標到達装
置に関する。
【0002】
【従来の技術】移動機械を目標地点に到達させることを
行う場合には、移動できる空間の地図や目標地点などの
座標データをすべて入力し、その空間の地図を頼りに移
動経路を計算することが行われる。このような場合に
は、移動経路を予め移動前に計算し、その軌道を忠実に
描けるように、移動機械に位置センサーを取り付け、セ
ンサーの値を見ながら移動することが行われる。この場
合、移動機械の一回の移動量は一定にされている。
行う場合には、移動できる空間の地図や目標地点などの
座標データをすべて入力し、その空間の地図を頼りに移
動経路を計算することが行われる。このような場合に
は、移動経路を予め移動前に計算し、その軌道を忠実に
描けるように、移動機械に位置センサーを取り付け、セ
ンサーの値を見ながら移動することが行われる。この場
合、移動機械の一回の移動量は一定にされている。
【0003】
【発明が解決しようとする課題】従来の移動機械は、移
動機械の移動指標範囲を示した地図を予め与える必要が
ある。また、その移動指標地図のみを頼りに移動するの
で、移動中の地図の変化は許されなかった。しかしなが
ら、機械の移動範囲や移動場所を変える度に、地図を入
力し直すことは多くの手間を要し、更に現実の世界で移
動する移動機械などは予め目標までの地図などが与えら
れたとしても、障害物などが移動することなどが考えら
れるので、地図が変化しないことは考えられない。この
ような場合においても移動機械が自ら移動指標地図を生
成し、地図の変化にも柔軟に適応できる機構が必要であ
る。更に、従来は一回の移動量は予め決められていた
が、これも状況に応じて、一回の移動量を適正に決定す
る必要がある。
動機械の移動指標範囲を示した地図を予め与える必要が
ある。また、その移動指標地図のみを頼りに移動するの
で、移動中の地図の変化は許されなかった。しかしなが
ら、機械の移動範囲や移動場所を変える度に、地図を入
力し直すことは多くの手間を要し、更に現実の世界で移
動する移動機械などは予め目標までの地図などが与えら
れたとしても、障害物などが移動することなどが考えら
れるので、地図が変化しないことは考えられない。この
ような場合においても移動機械が自ら移動指標地図を生
成し、地図の変化にも柔軟に適応できる機構が必要であ
る。更に、従来は一回の移動量は予め決められていた
が、これも状況に応じて、一回の移動量を適正に決定す
る必要がある。
【0004】本発明は、上記に鑑みてなされたもので、
その目的とするところは、移動指標地図がなくても、移
動指標地図を自ら作成しながら目標に到達することがで
きる神経回路網型適応目標到達装置を提供することにあ
る。
その目的とするところは、移動指標地図がなくても、移
動指標地図を自ら作成しながら目標に到達することがで
きる神経回路網型適応目標到達装置を提供することにあ
る。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明の神経回路網型適応目標到達装置は、目標地
点から発信される信号を基に該目標地点に到達する目標
到達装置であって、前記信号を受信する信号受信部と、
前記信号の時間変化を移動量によって正規化し、その値
を報酬とする信号変換部と、以前の状態、移動、および
前記信号変換部により生成された報酬値の関係を表す関
数を層構造の神経回路網に学習させる学習処理部と、前
記信号受信部から現在の状態に関する情報を受け取ると
ともに、前記学習処理部によって学習された関数の勾配
方向の要素を前記神経回路網の出力層から入力層へ伝搬
し、該関数の勾配方向の要素に基づいて状態を示す入力
ユニット以外の入力ユニットの出力を変化させることを
繰り返すことにより、前記学習処理部で学習された関数
の最大点を求める関数最大点探索部と、該関数最大点探
索部によって求められた関数の最大点を移動に変換する
数値変換部と、該数値変換部によって変換された移動を
起こす動力伝達部と、前記信号受信部、前記信号変換
部、前記学習処理部、前記関数最大点探索部、前記数値
変換部および前記動力伝達部を制御する制御部とを有す
ることを要旨とする。
め、本発明の神経回路網型適応目標到達装置は、目標地
点から発信される信号を基に該目標地点に到達する目標
到達装置であって、前記信号を受信する信号受信部と、
前記信号の時間変化を移動量によって正規化し、その値
を報酬とする信号変換部と、以前の状態、移動、および
前記信号変換部により生成された報酬値の関係を表す関
数を層構造の神経回路網に学習させる学習処理部と、前
記信号受信部から現在の状態に関する情報を受け取ると
ともに、前記学習処理部によって学習された関数の勾配
方向の要素を前記神経回路網の出力層から入力層へ伝搬
し、該関数の勾配方向の要素に基づいて状態を示す入力
ユニット以外の入力ユニットの出力を変化させることを
繰り返すことにより、前記学習処理部で学習された関数
の最大点を求める関数最大点探索部と、該関数最大点探
索部によって求められた関数の最大点を移動に変換する
数値変換部と、該数値変換部によって変換された移動を
起こす動力伝達部と、前記信号受信部、前記信号変換
部、前記学習処理部、前記関数最大点探索部、前記数値
変換部および前記動力伝達部を制御する制御部とを有す
ることを要旨とする。
【0006】
【作用】本発明の神経回路網型適応目標到達装置では、
現在の状態に関する情報を受け取るとともに、以前の状
態、移動および信号の時間変化を移動量によって正規化
した値である報酬値の関係を表す関数を層構造の神経回
路網に学習させ、この学習された関数の勾配方向の要素
を神経回路網の出力層から入力層へ伝搬し、該関数の勾
配方向の要素に基づいて状態を示す入力ユニット以外の
入力ユニットの出力を変化させることを繰り返して、学
習処理部で学習された関数の最大点を求め、この関数の
最大点を移動に変換し、この移動を動力伝達部で行う。
現在の状態に関する情報を受け取るとともに、以前の状
態、移動および信号の時間変化を移動量によって正規化
した値である報酬値の関係を表す関数を層構造の神経回
路網に学習させ、この学習された関数の勾配方向の要素
を神経回路網の出力層から入力層へ伝搬し、該関数の勾
配方向の要素に基づいて状態を示す入力ユニット以外の
入力ユニットの出力を変化させることを繰り返して、学
習処理部で学習された関数の最大点を求め、この関数の
最大点を移動に変換し、この移動を動力伝達部で行う。
【0007】
【実施例】以下、図面を用いて本発明の実施例を説明す
る。
る。
【0008】図1は、本発明の一実施例に係わる神経回
路網型適応目標到達装置の構成を示すブロック図であ
る。同図に示す神経回路網型適応目標到達装置は、信号
を受信する信号受信部1、信号の時間変化を移動量によ
って正規化し、その値を報酬とする信号変換部2、以前
の状態と移動と前記信号変換部2によって生成された報
酬値の関係を表す関数を学習する学習処理部3、前記信
号受信部1から状態情報を受け取るとともに、現在の状
態から前記学習処理部3によって学習された関数の最大
点を求める関数最大点探索部4、該関数最大点探索部4
によって求められた関数の最大点を移動に変換する数値
変換部5、該数値変換部5によって変換された移動を起
こす動力伝達部6、および前記各部を制御する制御部7
から構成されている。
路網型適応目標到達装置の構成を示すブロック図であ
る。同図に示す神経回路網型適応目標到達装置は、信号
を受信する信号受信部1、信号の時間変化を移動量によ
って正規化し、その値を報酬とする信号変換部2、以前
の状態と移動と前記信号変換部2によって生成された報
酬値の関係を表す関数を学習する学習処理部3、前記信
号受信部1から状態情報を受け取るとともに、現在の状
態から前記学習処理部3によって学習された関数の最大
点を求める関数最大点探索部4、該関数最大点探索部4
によって求められた関数の最大点を移動に変換する数値
変換部5、該数値変換部5によって変換された移動を起
こす動力伝達部6、および前記各部を制御する制御部7
から構成されている。
【0009】このように構成される神経回路網型適応目
標到達装置として、目標点から電波を出力し、2次元空
間内で、その電波強度のみから目標地点に到達する移動
ロボットを考えると、この移動ロボットは電波を受信す
るアンテナおよび車輪などを駆動してその移動速度を制
御できる機械を有する。
標到達装置として、目標点から電波を出力し、2次元空
間内で、その電波強度のみから目標地点に到達する移動
ロボットを考えると、この移動ロボットは電波を受信す
るアンテナおよび車輪などを駆動してその移動速度を制
御できる機械を有する。
【0010】この移動ロボットは、電波を信号受信部1
によって受信し、その強度を計測する。また、信号変換
部2では、この計測した強度をIt とし、移動した速度
をV={Vx ,Vy }とすると、次に示す式(1)を計
算し、報酬値Rt に変換する。
によって受信し、その強度を計測する。また、信号変換
部2では、この計測した強度をIt とし、移動した速度
をV={Vx ,Vy }とすると、次に示す式(1)を計
算し、報酬値Rt に変換する。
【0011】
【数1】 以前の状態(ロボットの座標)をSt-1 ={x,y}と
して、Rt =f(St- 1 ,Vt )を学習処理部3におい
て学習する。学習は、図2に示すような3層の神経回路
網と誤差逆伝搬法を用いて行われる。3層のうち、入力
層に状態St-1とVt を入力し、出力層に教師信号とし
てRt を与える。また、出力層のユニットは1つであ
る。
して、Rt =f(St- 1 ,Vt )を学習処理部3におい
て学習する。学習は、図2に示すような3層の神経回路
網と誤差逆伝搬法を用いて行われる。3層のうち、入力
層に状態St-1とVt を入力し、出力層に教師信号とし
てRt を与える。また、出力層のユニットは1つであ
る。
【0012】上記学習処理部3によって学習された関数
は、入力層(1層目)と隠れ層(2 とすると、次式のように書き表される。
は、入力層(1層目)と隠れ層(2 とすると、次式のように書き表される。
【0013】
【数2】 通常、g(x)は以下の式で表させるS状関数を用い
る。
る。
【0014】
【数3】 ここで、式(2)を用いて、現在の状態St を固定し、
Rが最大になるVを求めることを関数最大点探索部4に
おいて行う。これは、神経ユニットに以下のような機構
を設けることによって実現できる。
Rが最大になるVを求めることを関数最大点探索部4に
おいて行う。これは、神経ユニットに以下のような機構
を設けることによって実現できる。
【0015】出力層のユニットは、ユニットの現在の出
力をOt とすると、Ot (1−Ot)を計算する。この
計算結果を隠れ層のユニットにそれぞれ伝える。隠れ層
のユニットの出力(Hj とする)は、以下の式に従う。
力をOt とすると、Ot (1−Ot)を計算する。この
計算結果を隠れ層のユニットにそれぞれ伝える。隠れ層
のユニットの出力(Hj とする)は、以下の式に従う。
【0016】
【数4】 更に、入力ユニットの出力の変化は、以下の式に従う。
【0017】
【数5】 式(4),(5)を行い、式(5)によって変化した入
力ユニットの値(出力:Ii )を用いて、隠れ層のユニ
ットは次式の計算を行い、ユニットの出力を決定する。
このとき、状態St を表すユニットに関しては、式
(5)の操作は行わない。
力ユニットの値(出力:Ii )を用いて、隠れ層のユニ
ットは次式の計算を行い、ユニットの出力を決定する。
このとき、状態St を表すユニットに関しては、式
(5)の操作は行わない。
【0018】
【数6】 出力ユニットも同様に式(6)で計算された隠れユニッ
トの出力を用いて、次式に従いユニットの出力を決定す
る。
トの出力を用いて、次式に従いユニットの出力を決定す
る。
【0019】
【数7】 この式(4),(5),(6),(7)の繰り返しによ
って、式(2)に示される関数の最大点を求めることが
できる。
って、式(2)に示される関数の最大点を求めることが
できる。
【0020】以上の操作によって得られた関数の最大点
I={Ii }={Vx ,Vy }を数値変換部5によって
動力伝達部6の信号に変換する。そして、動力伝達部6
が信号を解釈し、動力を発生し、ロボットを移動させ
る。
I={Ii }={Vx ,Vy }を数値変換部5によって
動力伝達部6の信号に変換する。そして、動力伝達部6
が信号を解釈し、動力を発生し、ロボットを移動させ
る。
【0021】上述した信号受信部1から動力伝達部6ま
での操作を繰り返すことによって、ロボットは電波強度
の強い方に移動し、最終的には目標へ到達することがで
きる。
での操作を繰り返すことによって、ロボットは電波強度
の強い方に移動し、最終的には目標へ到達することがで
きる。
【0022】次に、計算機シミュレーションの結果を示
す。計算機上に作られた512×400の空間の中のあ
る地点(256,200)に目標があり、そこから電波
が出ている時に出発点(20,20)から目標に到達さ
せることを行わせた。その時のロボットの軌跡を図3に
示す。動力は移動速度−3以上3以下を発生するものと
した。この時、動力伝達部6に送られた信号の回数は1
19回であった。更にこの時形成された目標に向かうた
めの速度を表す移動指標地図を図4に示す。同図からわ
かるように、本神経回路網型適応目標到達装置は、移動
指標地図が予め与えられなくても、自ら移動指標地図を
作成し、移動量も決定することができるものである。
す。計算機上に作られた512×400の空間の中のあ
る地点(256,200)に目標があり、そこから電波
が出ている時に出発点(20,20)から目標に到達さ
せることを行わせた。その時のロボットの軌跡を図3に
示す。動力は移動速度−3以上3以下を発生するものと
した。この時、動力伝達部6に送られた信号の回数は1
19回であった。更にこの時形成された目標に向かうた
めの速度を表す移動指標地図を図4に示す。同図からわ
かるように、本神経回路網型適応目標到達装置は、移動
指標地図が予め与えられなくても、自ら移動指標地図を
作成し、移動量も決定することができるものである。
【0023】
【発明の効果】以上説明したように、本発明によれば、
現在の状態に関する情報を受け取り、学習処理部によっ
て学習された関数の勾配方向の要素を神経回路網の出力
層から入力層へ伝搬し、該関数の勾配方向の要素に基づ
いて状態を示す入力ユニット以外の入力ユニットの出力
を変化させることを繰り返して、学習処理部で学習され
た関数の最大点を求め、この関数の最大点を移動に変換
し、この移動を動力伝達部で行うので、予め移動指標地
図を持たなくても、移動指標地図を自ら作成しながら、
目標に到達することができる。また、本発明では、動力
伝達装置の出力を規定していないので、速度を明示的に
指定できない場合においても応用が可能である。摩擦の
ない宇宙空間などでロケットを噴射し姿勢制御を行うこ
とや、多関節ロボットの足を動かして目標に到達するこ
とも可能である。このように、動力伝達装置がどのよう
な出力であっても適応でき、幅広い応用がある。
現在の状態に関する情報を受け取り、学習処理部によっ
て学習された関数の勾配方向の要素を神経回路網の出力
層から入力層へ伝搬し、該関数の勾配方向の要素に基づ
いて状態を示す入力ユニット以外の入力ユニットの出力
を変化させることを繰り返して、学習処理部で学習され
た関数の最大点を求め、この関数の最大点を移動に変換
し、この移動を動力伝達部で行うので、予め移動指標地
図を持たなくても、移動指標地図を自ら作成しながら、
目標に到達することができる。また、本発明では、動力
伝達装置の出力を規定していないので、速度を明示的に
指定できない場合においても応用が可能である。摩擦の
ない宇宙空間などでロケットを噴射し姿勢制御を行うこ
とや、多関節ロボットの足を動かして目標に到達するこ
とも可能である。このように、動力伝達装置がどのよう
な出力であっても適応でき、幅広い応用がある。
【図1】本発明の一実施例に係わる神経回路網型適応目
標到達装置の構成を示すブロック図である。
標到達装置の構成を示すブロック図である。
【図2】図1の実施例に使用される層状神経回路網を示
す図である。
す図である。
【図3】図1の実施例による目標までの軌跡である移動
経路を示す図である。
経路を示す図である。
【図4】図1の実施例において形成される移動指標地図
を示す図である。
を示す図である。
1 信号受信部 2 信号変換部 3 学習処理部 4 関数最大点探索部 5 数値変換部 6 動力伝達部 7 制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 曽根原 登 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内
Claims (1)
- 【請求項1】 目標地点から発信される信号を基に該目
標地点に到達する目標到達装置であって、 前記信号を受信する信号受信部と、 前記信号の時間変化を移動量によって正規化し、その値
を報酬とする信号変換部と、 以前の状態、移動、および前記信号変換部により生成さ
れた報酬値の関係を表す関数を層構造の神経回路網に学
習させる学習処理部と、 前記信号受信部から現在の状態に関する情報を受け取る
とともに、前記学習処理部によって学習された関数の勾
配方向の要素を前記神経回路網の出力層から入力層へ伝
搬し、該関数の勾配方向の要素に基づいて状態を示す入
力ユニット以外の入力ユニットの出力を変化させること
を繰り返すことにより、前記学習処理部で学習された関
数の最大点を求める関数最大点探索部と、 該関数最大点探索部によって求められた関数の最大点を
移動に変換する数値変換部と、 該数値変換部によって変換された移動を起こす動力伝達
部と、 前記信号受信部、前記信号変換部、前記学習処理部、前
記関数最大点探索部、前記数値変換部および前記動力伝
達部を制御する制御部とを有することを特徴とする神経
回路網型適応目標到達装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5144963A JPH076145A (ja) | 1993-06-16 | 1993-06-16 | 神経回路網型適応目標到達装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5144963A JPH076145A (ja) | 1993-06-16 | 1993-06-16 | 神経回路網型適応目標到達装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH076145A true JPH076145A (ja) | 1995-01-10 |
Family
ID=15374272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5144963A Pending JPH076145A (ja) | 1993-06-16 | 1993-06-16 | 神経回路網型適応目標到達装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH076145A (ja) |
-
1993
- 1993-06-16 JP JP5144963A patent/JPH076145A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8694451B2 (en) | Neural network system | |
US5479571A (en) | Neural node network and model, and method of teaching same | |
US20160096272A1 (en) | Apparatus and methods for training of robots | |
Efe et al. | A comparative study of neural network structures in identification of nonlinear systems | |
CN112631128B (zh) | 一种多模异构信息融合的机器人装配技能学习方法及系统 | |
EP0357016A2 (en) | Neuron architecture | |
CN110323981A (zh) | 一种控制永磁同步直线电机的方法及系统 | |
Wang et al. | Adaptive fuzzy visual tracking control for manipulator with quantized saturation input | |
CN110300075A (zh) | 一种无线信道估计方法 | |
Efe et al. | A comparative study of soft-computing methodologies in identification of robotic manipulators | |
CN116638507A (zh) | 一种自适应阻抗控制与预测控制相结合的遥操作控制方法 | |
Ejaz et al. | Autonomous visual navigation using deep reinforcement learning: An overview | |
JPH076145A (ja) | 神経回路網型適応目標到達装置 | |
CN111709789A (zh) | 一种用户转化率的确定方法及相关设备 | |
Fezari et al. | A voice command system for autonomous robots guidance | |
WO2023104880A1 (en) | Controlling interactive agents using multi-modal inputs | |
CN114020908A (zh) | 文本分类方法及装置、计算机可读存储介质及电子设备 | |
JP3523325B2 (ja) | ニューラルネットワーク及びこれを用いた信号処理装置、自律システム、自律型ロボット並びに移動システム | |
CN111796679A (zh) | 一种远程电磁触觉再现系统、磁场生成及触觉预测方法 | |
JPH0981535A (ja) | ニューラルネットワークの学習方法 | |
CN118438457B (zh) | 基于脉冲混合强化学习组装任务的单机械臂运动规划方法 | |
CN115256372A (zh) | 机械臂控制方法、装置、控制设备及存储介质 | |
CN112702286B (zh) | 一种无人机通信中下行信道估计方法 | |
JPH11211396A (ja) | 飛しょう体の誘導装置 | |
JPH06149357A (ja) | 径路の学習方法およびガイダンス方法 |