JPH06337713A - 自律移動ロボット走行制御装置 - Google Patents

自律移動ロボット走行制御装置

Info

Publication number
JPH06337713A
JPH06337713A JP5128825A JP12882593A JPH06337713A JP H06337713 A JPH06337713 A JP H06337713A JP 5128825 A JP5128825 A JP 5128825A JP 12882593 A JP12882593 A JP 12882593A JP H06337713 A JPH06337713 A JP H06337713A
Authority
JP
Japan
Prior art keywords
learning
mobile robot
neural network
unit
dynamics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5128825A
Other languages
English (en)
Inventor
Yukio Kuroda
幸男 黒田
Koji Ono
宏司 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota Central R&D Labs Inc
Original Assignee
Toyota Motor Corp
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota Central R&D Labs Inc filed Critical Toyota Motor Corp
Priority to JP5128825A priority Critical patent/JPH06337713A/ja
Publication of JPH06337713A publication Critical patent/JPH06337713A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Feedback Control In General (AREA)

Abstract

(57)【要約】 【目的】 制御系の特性を学習するニューラルネットワ
ークを備えた自律移動ロボット走行制御装置において、
学習の収束性を高め、学習時間を低減し、さらに、正確
な制御を可能にする自律移動ロボット走行制御装置を提
供する。 【構成】 制御系の特性を学習するニューラルネットワ
ークが、移動ロボットの軌道特性を学習するキネマティ
クス部20と、移動ロボットの動特性を学習するダイナ
ミクス部21とを、それぞれ独立の処理部として含むこ
とにより、無関係なユニット間結合を排除する。また、
ニューラルネットワークは自律移動ロボットの既知特性
を予め学習させた既知構造部を含むことにより、無駄な
学習を低減する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は自律移動ロボット走行
制御装置に係り、特に工場等で用いられる無人搬送車や
警備ロボット等に適用して円滑な運動を実現するに好適
な自律移動ロボット走行制御装置に関する。
【0002】
【従来の技術】従来から、工場内搬送車や警備ロボット
等の自律走行には、大きく分けて2つの手法による走行
制御が行われている。
【0003】1つは、比例制御、積分制御、比例積分微
分制御等の、古典的な制御方法であり、フィードバック
制御やフィードフォワード制御と組み合わせて用いられ
る。しかしながら、このような古典的な制御方法は、摩
擦や粘性等の非線形要素を多く含んだ制御には不適切で
ある。なぜなら、このような古典的な方法では非線形問
題を線形近似で解いているため、誤差が多くなり、また
累積誤差も多くなるからである。またフィードバック制
御の場合は時間遅れも問題となってくる。更に、タイヤ
の摩耗やオイルの粘性変化等の、ロボットの経時変化に
対応するためには、頻繁なゲイン調整が必要になってく
ることも問題である。つまり、ロボットの経時変化に対
応するためには、制御対象の特性が変化する毎に各種の
制御パラメータを設定し直す必要があるのだが、設備稼
働率などを勘案すると、頻繁なパラメータの設定変更
は、非実用的であると言わざるを得ない。
【0004】これに対して、近年ニューラルネットワー
クによる制御が注目されている。これは、例えば、特開
平3−235101号に開示されるような多層パーセプ
トロン型ニューラルネットワークによる学習型の制御方
式である。ニューラルネットワークによる制御では、非
線形問題にそのまま対応できるばかりでなく、学習機能
を有するために、パラメータの設定変更が不要になると
いう利点がある。
【0005】今、図20に示すような移動ロボットを想
定する。図において、16は移動ロボットであり、右車
輪1と左車輪2およびキャスター車輪5により走行す
る。3は右車輪1を駆動する右車輪駆動モータ、4は左
車輪2を駆動する左車輪駆動モータである。
【0006】右車輪駆動モータ3は右車輪1に対してτ
r なる駆動トルクを与える。一方、左車輪駆動モータ4
は左車輪2に対してτl なる駆動トルクを与える。その
結果、移動ロボット16は速度vで走行するが、この場
合、右車輪駆動モータ3と左車輪駆動モータ4の回転速
度が異なれば車体角θが変わる。この場合の角度の変化
速度は、角速度ωで与えられる。以上のようにして、右
車輪駆動モータ3と左車輪駆動モータ4の駆動により、
移動ロボット16は、その位置x、yを変化させる。
【0007】ここで、速度v、右車輪駆動トルクτr 、
左車輪駆動トルクτl 、角速度ωは移動ロボット16自
体の動特性に関するデータであり、ダイナミクスと呼
ぶ。一方、位置x、位置y、車体角θは移動ロボット1
6の軌道に関するデータであり、キネマティクスと呼
ぶ。
【0008】以上のような移動ロボットを走行制御する
に当り、ニューラルネットワークを適用する場合、従来
は、図21に示すような、多層パーセプトロン型ニュー
ラルネットワークが用いられていた。このニューラルネ
ットワークは入力層17、中間層18、出力層19で構
成される。
【0009】入力層17の各ユニットには、ある時間ス
テップkにおける移動ロボット16の位置x(k)、位
置y(k)、車体角θ(k)、角速度ω(k)、速度v
(k)、右車輪駆動トルクτr (k)、左車輪駆動トル
クτl (k)が与えられる。入力層17の全ユニットは
中間層18の全ユニットに結合されている。
【0010】以上のような構成において、入力層17に
ダイナミクスとキネマティクスのそれぞれに対応する教
師データを一度に与えることにより、ニューラルネット
ワークは学習する。この学習により、ユニット間結合の
大きさが変化して行き、非線形な因果関係にも対応した
学習結果が得られる。この学習結果は、中間層18の全
ユニットに結合される出力層19のユニットを通じて、
入力の次の時間ステップであるk+1における移動ロボ
ット16の位置x(k+1)、位置y(k+1)、車体
角θ(k+1)、角速度ω(k+1)、速度v(k+
1)として出力される。
【0011】さて、以上のようなニューラルネットワー
クに、図22に示すような教師データを用いて学習させ
る実験を行った。教師データとしては、A1ないしA5
の5つのパターンを与えた。この実験による学習結果
は、図23に示すとおりである。図23からも明らかな
ように、教師データA1ないしA5に対応する学習結果
E1ないしE5は、収束していない。
【0012】図23に示した実験結果は、実用上妥当な
数の教師データを与えてニューラルネットワークの学習
を行った例であるが、図からわかるように収束していな
い。そこで、実用性を無視して更に多くの教師データを
与えてニューラルネットワーク自体の収束性を調べる実
験を行った。その結果を図24および図25に示す。図
24(A)、(B)および(C)は、それぞれ図22に
示したパターンA1を学習させた場合の移動ロボットの
位置x、y、および車体角θに関する教師データと学習
結果との関係を示すものである。また、図25(A)、
(B)および(C)は、それぞれ図22に示したパター
ンA5を学習させた場合の移動ロボットの位置x、yお
よび車体角θに関する教師データと学習結果との関係を
示すものである。
【0013】図24および図25から明らかなように学
習する際の教師データの数を多くした場合、学習はある
程度収束するものの、依然として無視できない誤差が残
ることがわかる。
【0014】
【発明が解決しようとする課題】以上述べたように、従
来の多層パーセプトロン型ニューラルネットワークを用
いた自律移動ロボット走行制御装置は学習の収束性が悪
いという問題があった。これは、従来例におけるニュー
ラルネットワークが、各層のユニットそれぞれが他の層
の全てに結合している構造となっているため、必要以上
に結合数が多く、冗長度が大きすぎるためである。
【0015】また、従来例では、制御対象の特性として
次元の違う特性であるキネマティクスとダイナミクスの
学習を同一のニューラルネットワークで行っているた
め、汎化能力に限界があるという問題があった。
【0016】この発明は上記のような従来技術の問題点
を解消し、学習時間の大幅な低減と正確な制御を可能に
した自律移動ロボット走行制御装置を提供することを目
的とする。
【0017】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、制御系の特性を学習するニューラルネッ
トワークを備えた自律移動ロボット走行制御装置におい
て、前記ニューラルネットワークが自律移動ロボットの
軌道特性を学習するキネマティクス部と、自律移動ロボ
ットの動特性を学習するダイナミクス部と、を含み、前
記キネマティクス部および前記ダイナミクス部はそれぞ
れ独立された処理部として構成され、前記ニューラルネ
ットワークは自律移動ロボットの既知特性を予め学習さ
せた既知構造部を含むことを特徴とする。
【0018】
【作用】本発明にかかる自律移動ロボット走行制御装置
は以上のような構成を有しており、制御対象の特性とし
て次元の違う特性である自律移動ロボットの軌道特性と
自律移動ロボットの動特性が、それぞれキネマティクス
部とダイナミクス部において独立に学習される。このた
めニューラルネットワークの構成においてユニット間の
結合数が少なくなり学習の収束性がよくなり、学習に要
する時間が短縮される。
【0019】また、ニューラルネットワークは、制御対
象である自律移動ロボットに関する先見的知識を既知特
性として予め学習させた既知構造部を含むため、学習に
要する時間が短縮される。
【0020】
【実施例】以下、図面を参照しながら、この発明の実施
例を説明する。
【0021】図1はこの発明の第一実施例に係る自律移
動ロボット運動制御装置のブロック図である。図におい
て、7は与えられた入力データに対しニューラルネット
ワークによるキネマティクスの補償を行い、補正された
移動ロボットの速度v* 、角速度ω* を出力するニュー
ラルネットワークキネマティクス補償部、8はニューラ
ルネットワークキネマティクス補償部7より速度v* 、
角速度ω* を与えられ、これを右車輪の回転角速度ωr
*、左車輪の回転角速度ωl*に変換する変換部、9は変
換部8より各車輪の回転角速度ωr*、ωl*を与えられ、
ニューラルネットワークによるフィードバック誤差の誤
差逆伝搬学習を行い、右車輪駆動トルク値τr と左車輪
駆動トルク値τl を出力するニューラルネットワークフ
ィードバック誤差学習部、10はニューラルネットワー
クフィードバック誤差学習部9より出力される右車輪駆
動トルク値τr と左車輪駆動トルク値τl に基づき移動
ロボットを走行させたときの移動ロボットの動特性を示
す要素であり、ロボットダイナミクスと呼ぶ。ロボット
ダイナミクス10により左右両車輪の駆動トルク値τr
、τl から右車輪の回転角速度ωr 、左車輪の回転角
速度ωl が求められる。11はロボットダイナミクス1
0で求められた左右両輪の回転角速度ωr 、ωlに基づ
き移動ロボットを走行させたときの移動ロボットの軌道
特性を示す要素であり、ロボットキネマティクスと呼
ぶ。ロボットキネマティクス11により左右両輪の回転
角速度ωr 、ωl から移動ロボットの速度v、角速度ω
が求められる。12はロボットキネマティクス11から
の自律移動ロボットの速度v、角速度ωを、位置x、
y、および車体角θに変換する変換部である。
【0022】なお、図1の構成において、ロボットダイ
ナミクス10からの出力はニューラルネットワークフィ
ードバック誤差学習部9にフィードバックされる。ニュ
ーラルネットワーク誤差学習部9とロボットダイナミク
ス10は逆ダイナミクスモデル13を構成している。ま
た、ロボットキネマティクス11からの出力はニューラ
ルネットワークキネマティクス補償部7にフィードバッ
クされる。ニューラルネットワークキネマティクス補償
部7から変換部12までの系は順キネマティクス・ダイ
ナミクスモデル14を構成している。また、図1のニュ
ーラルネットワークは単純なパーセプトロン型ではな
く、制御対象の特徴を十分に考慮した構造となってい
る。
【0023】次に本発明の第二実施例について説明す
る。本実施例におけるニューラルネットワークは図2の
ブロック図に示すように、自律移動ロボットの軌道特性
を学習するキネマティクス部20と、自律移動ロボット
の動特性を学習するダイナミクス部21の二重構造にな
っており、キネマティクス部20とダイナミクス部21
はそれぞれ独立した処理部として構成されている。さら
に、ニューラルネットワークには制御対象に含まれる既
知な非線形関数、つまり
【0024】
【式1】
【0025】
【式2】
【0026】
【式3】 を計算するように予め学習させた既知構造部22が組み
込まれる。従来のニューラルネットワークが制御対象に
関する先見的知識を全く利用しておらず一様な構造の神
経回路モデルでしかなかったのに対して、この実施例の
ニューラルネットワークでは、制御対象に含まれること
が予め判っている非線形関数をニューラルネットモデル
内に既知構造部22として組み込み、これに誤差逆伝搬
学習(バックプロパゲーションアルゴリズム)を適用す
るように構成される。
【0027】また、同様に、ユニット間結合の制御対象
への関与が極めて小さいということが判っている場合、
その結合を省略する。つまり、ニューラルネットモデル
ではユニット間結合が存在する限りは、制御対象への関
与の大きな関数と全く等価に学習の対象となり、学習の
結果のいかんにかかわらず、学習には所定の時間を要す
ることになるが、この実施例では、無駄なユニット間結
合を排除することで、学習時間を低減するように構成さ
れる。
【0028】図2の構成において、ある時間ステップk
における移動ロボットのダイナミクスに関するデータ、
速度v(k)、角速度ω(k)、右車輪駆動トルクτr
(k)、左車輪駆動トルクτl (k)がダイナミクス部
21に与えられる。ここで、入力層の全てのユニットは
続く層の全てのユニットに接続されている。ダイナミク
ス部21からは、入力の次の時間ステップk+1におけ
る速度v(k+1)と角速度ω(k+1)が導出され
る。
【0029】また、キネマティクス部20には、ある時
間ステップkにおける移動ロボットの位置x(k)、y
(k)、車体角θ(k)、速度v(k)および角速度ω
(k)が与えられる。ここで、ニューラルネットワーク
のそれぞれのユニット間結合は、必要最小限度の結合と
され、すでに制御対象に含まれている非線形な関係は既
知構造部22に組み込まれる。例えば、位置x(k)や
y(k)等は、ニューラルネットワークの中のユニット
に結合されず、式1および式2から求められる時間ステ
ップ間の変位と足し合わされるだけである。
【0030】以上のような構成によれば、部分的に全く
独立に扱うことのできるキネマティクスに関する学習と
ダイナミクスに関する学習を、それぞれキネマティクス
部20とダイナミクス部21で独立して行うことができ
る。さらに、予め影響を及ぼさないことが判明している
ユニット間結合を省略すると共に既知構造部22を組み
込むことにより、学習回数を大幅に低減することができ
る。また、従来型のニューラルネットワークに比べてユ
ニット間結合が大幅に低減できるので、学習の収束が早
く、より正確な学習が可能になる。
【0031】図3、図4はこの発明の第三実施例に係る
自律移動ロボット運動制御装置のブロック図である。な
お、図3は学習モードを、図4は軌道生成モードをそれ
ぞれ示すものである。さて、各図に示すように、キネマ
ティクス部20とダイナミクス部21とはカスケード接
続されているが、これは時系列データを扱えるようにす
るためである。
【0032】ちなみに、この実施例は、ニューラルネッ
トの並列性を利用した構造であり、時空間や状態空間上
に多数のニューロンを配置し、ニューロン間の相互作用
により、分散、並列的に問題を解く手法を利用してい
る。これは、繰り返し構造神経回路(カスケードモデ
ル)として知られているものである。
【0033】図3において、初期状態を示す各データ、
すなわち位置x0 、y0 、車体角θ0 、速度v0 、およ
び角速度ω0 がキネマティクス部20とダイナミクス部
21に与えられる。制御対象23である移動ロボットの
発生する右車輪駆動トルクの値τr 、左車輪駆動トルク
の値τl はそれぞれの時間経過に対応してダイナミクス
部21に入力される。制御対象23の実際の軌道および
速度、角速度のデータは、カスケード接続されるそれぞ
れのニューラルネットワーク要素の出力値と、それぞれ
つき合わされ、誤差逆伝搬学習が適用される。
【0034】一方、図4において示すように、軌道生成
モードでは、学習モードにおいて制御対象23の特性を
学習したニューラルネットワークを用いる。その動作
は、まず、初期状態のデータが入力されると前述の学習
済みのカスケードニューラルネットワークにより終点状
態の各データの値が計算される。この終点状態の値は、
上位モータセンタ24から与えられる所望の終点状態の
値(目標値)と比較され、その差が誤差としてカスケー
ドニューラルネットワークに逆伝搬され、所望の終点状
態に至るためのそれぞれの時間ステップにおける左右車
輪の駆動トルク値が求められる。このとき、各ダイナミ
クス部21の間は相互コンダクタンスgで結合され、前
後の時間ステップにおけるトルクの値が伝達される。
【0035】さて、制御対象23の入出力つまり、位置
x、y、速度v、車体角θ、角速度ω、右車輪駆動トル
クτr 、左車輪駆動トルクτl は時空間パターンなの
で、これを神経回路を用いて空間パターンとして表現す
る必要がある。つまり、軌道や速度などを微小時間Δt
(制御周期)で離散化して、時系列パターンに置き換
え、さらに、各時間ステップにおけるこれらの入力に対
応する入力ニューロンを用意している。
【0036】図3の構成は、左右輪駆動トルク変化最小
基準による軌道制御を行うための繰り返し構造神経回路
モデル、つまり順モデルの学習モード時の構成である。
【0037】この神経回路は、図2に示したキネマティ
クス部20とダイナミクス部21を2つの神経回路で構
成されるモジュール構造を基本的な構成要素、つまり単
位回路として、これを何段にも連結した構造となってい
る。
【0038】それぞれの単位回路は、運動時間の各時間
ステップに対応して配列されており、神経回路全体でN
個ある。つまり、運動時間がNΔtである。
【0039】図3、4に示すように、キネマティクス部
20、ダイナミクス部21の各単位回路においては、そ
の時点での位置x、y、車体角θ、速度v、角速度ω、
右車輪駆動トルクτr 、左車輪駆動トルクτl 等が入力
されて、単位時間Δt後の位置x、y、車体角θ、速度
v、角速度ωが出力されるように、神経回路が構成され
ている。この神経回路は、学習モードと軌道生成モード
の2つのモードで動作する。
【0040】学習モードでは、各単位回路の出力と教師
データの誤差の2乗和を最小にするようにバックプロパ
ゲーションアルゴリズムにより学習する。各単位回路を
構成するキネマティクス部20およびダイナミクス部2
1における各ユニット間の結合荷重をこのアルゴリズム
によって変化させることにより学習を行う。これによ
り、制御対象23の特性を神経回路に学習させる。な
お、既知構造部22のユニット間の結合は、予め前述の
式1、式2および式3を計算するように学習させてある
が、実際の自律移動ロボットの特性を学習する際にも、
その式に当てはまらない特性を学習するために結合荷重
が変化させられる。
【0041】いま、説明を簡単にするために、k番目の
単位回路を構成するダイナミクス部21の出力する速度
vおよび角速度ωをベクトルZD[k]で表し、キネマ
ティクス部20の出力する位置x、yと車体角θをベク
トルZK[k]で表すものとする。この場合、それぞれ
のベクトルは
【0042】
【式4】
【0043】
【式5】 で表される。そして、ダイナミクス部21、キネマティ
クス部20のそれぞれの教師信号を
【0044】
【式6】
【0045】
【式7】 で表すものとする。それぞれの誤差関数ED、EKは、
出力誤差の2乗和であり、それぞれ
【0046】
【式8】
【0047】
【式9】 として定義することができる。ここで、それぞれのダイ
ナミクス部21、キネマティクス部20のウエイトW
D、WKを誤差関数ED、EKの最急降下方向に変化さ
せようとすると、その修正量ΔWD、ΔWKはそれぞれ
【0048】
【式10】
【0049】
【式11】 となる。ただし、学習パラメータεd、εkは十分に小
さな正の値とする。
【0050】次に、軌道生成モードであるが、教師デー
タによる学習を十分に行って、制御対象23のダイナミ
クス内部モデルを獲得した後、この学習済み回路を用い
て最適軌道制御を行うことができる。
【0051】今、図4に示すように、学習時に入力とし
て各単位回路に制御対象から与えられていた右車輪駆動
トルクτr と左車輪駆動トルクτl および各時間ステッ
プにおける教師データは軌道生成モードでは完全に抑制
される。
【0052】代わって、運動終了時刻に対応しているN
番目の単位回路だけに、運動の最終目標状態、つまり、
目標点の位置x、y、制御対象23の車体角θ、速度
v、角速度ωに関する教師データT[N]だけが与えら
れる。教師データT[N]は、
【0053】
【式12】 で表される。第1単位回路に初期値が与えられると、学
習時と同様に、第1単位回路から第N単位回路の順に前
向き計算で各層の各ユニットの入力と出力が計算され
る。このように計算された第N単位回路から第1単位回
路の順に逆伝搬され、つまりバックプロパゲーションが
行われ、後ろ向き計算で誤差信号が伝達される。 誤差
信号は各単位回路のダイナミクス部21の第1層の3、
4番目のニューロン(以下、トルクニューロンと称す
る)だけに伝搬される。
【0054】したがって、軌道生成時には学習時に形成
されたシナプスの結合荷重の更新は行われず、誤差信号
は各単位回路のトルクニューロンの状態値変化のみに使
われる。
【0055】以上の具体的な方法が、トルク変化最小基
準を用いたものである。
【0056】トルク変化最小基準は、滑らかな運動を予
測、再現するための数学的モデルのひとつである。これ
は、制御対象23の右車輪駆動トルクτr 、左車輪駆動
トルクτl の時間変化率の2乗和の運動時間にわたって
の積分が最小になるように走行コースが決定されるとい
うものである。
【0057】いま、神経回路が推定した走行コースの最
終状態Z[N]と運動の最終目標状態T[N]との2乗
誤差を
【0058】
【式13】 とすると、右車輪駆動トルクτr と左車輪駆動トルクτ
l の誤差信号δτr [k]、δτl [k]は
【0059】
【式14】
【0060】
【式15】 で計算される。
【0061】k番目の右車輪駆動トルクτr と左車輪駆
動トルクτl のトルクニューロンに与えられる入力は、
誤差信号δτr [k]、δτl [k]だけである。ま
た、図4に示すように、隣り合う単位回路の左右車輪駆
動トルクニューロン同士は相互コンダクタンスgのギャ
ップ結合で電気的に結合されている。すなわち、これら
のニューロンは両隣の単位回路の左右車輪駆動トルクニ
ューロンの状態値の影響を相互コンダクタンスgを介し
て受けるようになっている。
【0062】この時の、k番目の単位回路の左右車輪駆
動トルクニューロンの状態値τr [k]、τl [k]の
変化は、次の微分方程式で記述できる。
【0063】
【式16】
【0064】
【式17】 ここで、sはニューロンの状態変化の時間を表し、cは
正の定数である。
【0065】いま、神経回路のエネルギー関数Lをトル
ク変化最小基準に基づき、目標点と運動の最終到達点の
誤差および左右車輪駆動トルク変化分の和の形で、
【0066】
【式18】 と定めると、Lは式16、式17により、時間sと共に
常に減少することが簡単に証明できる。つまり、神経回
路はそれ自身の非線形ダイナミクス、つまり式16、式
17で表される微分方程式にしたがって動作した後で、
Lの極小点で安定する。
【0067】さらに、ここでギャップ結合の相互コンダ
クタンスgの模擬的な焼き鈍しを行うと、大域的なLの
エネルギーの最小状態が達成される。
【0068】次に、軌道生成時の障害物の回避問題を考
える。
【0069】軌道生成モードにおいて、経由点や障害物
に関する情報を学習済の神経回路に送れば、障害物を回
避しながら、あるいは経由点を通過して、目標点に達す
る滑らかな軌道が生成される。
【0070】この場合には、障害物に関する情報がポテ
ンシャルの形でエネルギー関数Lに加わり、それに応じ
て左右車輪駆動トルクニューロンの状態変化を表す微分
方程式も修正される。
【0071】いま、障害物は中心が(C1、C2)、半
径がHの円であるとし、神経回路が推定した時刻kの制
御対象23の位置(x[k]、y[k])と障害物の中
心との距離をrkとする。つまり、
【0072】
【式19】 で、この時、障害物に対して、次のエネルギーE0を定
義する。
【0073】
【式20】 ただし、
【0074】
【式21】 このエネルギー関数E0をμで重み付けして、式18の
エネルギー関数Lに加え、次の関数L0を定義する。
【0075】
【式22】 k番目の単位回路の位置を出力するニューロンx
[k]、y[k]に対して、式23の誤差ηx[k]、
ηy[k]を通常のコース生成時の誤差に加えて、その
合計誤差を逆伝搬して神経回路を動作させると、L0が
リアプノフ関数になることが証明できる。
【0076】
【式23】
【0077】
【式24】
【0078】
【式25】 図5は前述の第三実施例のカスケードニューラルネット
ワークを用いた自律移動ロボットの制御系の一例であ
る。この構成は、自律移動ロボットの特性の学習が済ん
だカスケードニューラルネットワーク25を用いた自律
移動ロボットの制御段階を示すものである。この構成で
は、移動ロボットの初期状態を表わす初期値, すなわち
位置x0 、y0 、車体角θ0 、速度v0 および角速度ω
0 が与えられると、カスケードニューラルネットワーク
25がそれらに基づき右車輪の駆動トルク値τr と左車
輪の駆動トルク値τl を計算する。これら計算されたト
ルク値にしたがって自律移動ロボットを運行する。
【0079】さて、次に、上記第三実施例による繰り返
し構造神経回路モデルと左右車輪駆動トルク変化最小モ
デルを用いたシミュレーション実験について説明する。
【0080】いま、学習時の教師データとしては、図6
の説明図に示すように、A1ないしA5の5種類の走行
コースで移動ロボットが移動した場合のデータを用い
る。なお、C6ないしC9は汎化検証用、つまり未学習
コーステスト用の走行コースデータである。
【0081】この9種類の走行データは、移動ロボット
が、x、y、θに関する躍度最小基準で走行した場合の
シミュレーション用データである。それぞれ、走行時間
は11.5秒で、データ数は230組(50m秒毎にサ
ンプリング)である。
【0082】キネマティクス部20、ダイナミクス部2
1のそれぞれの繰り返し構造神経回路に、A1ないしA
5の5種類の教師データの中からランダムに選んだ1種
類のデータを与えることで、移動ロボットのキネマティ
クスとダイナミクスを学習させた。
【0083】学習回数および学習係数εはそれぞれ、 ND:学習回数100万回/5パターン、学習係数ε=
0.0005 NK:学習回数 3万回/5パターン、学習係数ε=
0.001 とした。
【0084】図7は走行パターンA4の場合の実験結果
を示すものであり、(A)は位置x、(B)は位置y、
(C)は車体角θ、(D)は速度v、(E)は角速度ω
に関して、それぞれ教師データと学習結果を示してい
る。
【0085】図8は走行パターンC6の場合の実験結果
を示すものであり、(A)は位置x、(B)は位置y、
(C)は車体角θ、(D)は速度v、(E)は角速度ω
に関して、それぞれ教師データと学習結果を示してい
る。
【0086】各図からも明らかなように、移動ロボット
の順モデル学習の結果は、教師データと学習結果がほと
んど重なる程度に良好に行われており、また、学習に用
いなかったテストデータとも良く一致し、学習が良好に
行われていることがわかる。なお、角速度ωに若干の学
習不足が見られるが、これは学習回数の増加により、十
分に解消可能な誤差である。
【0087】次に、先の教師データで学習済の神経回路
を用いて、走行コース生成のシミュレーション実験を行
った。焼き鈍しのパラメータとして、先の式16、式1
7のcおよび
【0088】
【式26】 のa、bを推定した。ただし、qは焼き鈍し回数であ
る。
【0089】実験条件a=5.0、b=5,000、c
=10.0でのシミュレーション実験結果、つまり神経
回路が生成したコースは、図9の説明図に示すようにな
った。ちなみに、図9の(A)は走行パターンA2に対
応する実際の生成軌道、(B)は走行パターンA4に対
応する生成軌道、(C)は走行パターンC6に対応する
生成軌道、(D)は走行パターンC8に対応する生成軌
道である。また、走行パターンA4、C6に対応する
x、y、θ、v、wの時間変化をそれぞれ図10、図1
1に示す。ちなみに、この走行コースは障害物がないと
した場合の生成軌道である。
【0090】図からも明らかなように、トルク変化が最
小で滑らかな軌道で目標点に到達する軌道が実現されて
いる。
【0091】なお、今回のシミュレーション実験では、
焼き鈍し回数を全て10000回とした。
【0092】次に、教師データで学習済の神経回路を用
いて、障害物がある場合の、走行コース生成のシミュレ
ーション実験を行った。これについては、以下の(a)
ないし(d)の4つの場合について、正規化平面上でシ
ュミレーションした。
【0093】(a)走行コースA2で、中心(X、Y)
=(0.375、0.5)に、半径0.125の円形の
障害物があった場合 (b)走行コースA4で、中心(X、Y)=(0.62
5、0.5)に、半径0.125の円形の障害物があっ
た場合 (c)走行コースC8で、中心(X、Y)=(0.37
5、0.5)に、半径0.125の円形の障害物があっ
た場合 (d)走行コースC6で、中心(X、Y)=(0.2
5、0.67)と、中心(X、Y)=(0.35、0.
67)と、中心(X、Y)=(0.45、0.67)
と、中心(X、Y)=(0.55、0.33)と、中心
(X、Y)=(0.65、0.33)と、中心(X、
Y)=(0.75、0.33)に、半径0.1の円形の
障害物があった場合 のそれぞれを想定する。
【0094】なお、c、gのパラメータは障害物のない
場合と同じである。それぞれの実験結果は、図12に示
す通りである。また、図13、図14に走行パターンA
4およびC6に対応するx、y、θ、v、wの時間変化
を示す。図からも明らかなように、障害物をうまく回避
して、目標点に到達する滑らかな軌道が実現される。な
お、この実験では、移動ロボットは質点とみなしてお
り、車幅は考慮されていない。
【0095】図15は従来型の3層ニューラルネットワ
ークとこの発明のニューラルネットワークによる学習の
収束曲線を比較して示したものである。図からも明らか
なように、この発明によれば、従来に比較して学習回数
を大幅に低減できる。
【0096】以上の結果より明らかなように、この発明
によれば、自律移動ロボット運動制御装置における学習
時間や汎化性を大幅に向上することができる。また、既
知構造を移動ロボットのものと自動車のものとを差し替
えることにより、自動車の無人運転制御にも適用するこ
とができる。
【0097】図16はこの発明の自律移動ロボット運動
制御装置を自動車の無人運転に適用した場合のブロック
図を示すものである。ここでは、自動車のステアリング
角としてδ(t)、自動車のアクセル開度としてa
(t)、自動車のブレーキ踏み込み度としてb(t)、
自動車のヨー角としてψ(t)、車速としてv(t)、
横変位量としてl(t)がパラメータとして用いられ
る。ちなみに、自動車のヨー角ψとは、図17に示すよ
うに、車の向きを示すパラメータであり、自動車の横変
位量lとは、図18に示すように、車の車線変更量を示
すパラメータである。さて、図16は自動車の車線変更
に伴う構成を例示しており、ダイナミクス部21には、
ステアリング角δ(k−1)、アクセル開度a(k−
1)、ブレーキ踏み込み度b(k−1)が入力される。
その結果、ダイナミクス部21からは、ヨー角ψ
(k)、車速v(k)が出力され、キネマティクス部2
0に与えられる。キネマティクス部20は、ヨー角ψ
(k)、車速v(k)に基づき、自動車の横変位量l
(k+1)を出力する。
【0098】つまり、自動車の無人運転における、操作
条件であるステアリング、アクセル、ブレーキから、車
線変更結果である横変位量を導出する系を構成できる。
【0099】図19はこの発明の第四実施例に係る自律
移動ロボット運動制御装置の部分ブロック図である。図
において、27は既知構造部22を含む既知構造ニュー
ラルネットワークであり、26は既知構造ニューラルネ
ットワーク27に付加される3層ニューラルネットワー
ク26である。
【0100】先に述べた各実施例の自律移動ロボット運
動制御装置を実際に運用する場合、既知構造部22を作
る上で考慮した式1、式2、式3だけでは表されない誤
差要因が含まれる。このような誤差要因を既知構造ニュ
ーラルネットワーク27に外付けされる3層ニューラル
ネットワーク26により吸収するようにすることで、実
際の運用時に生じた非線形性、例えば車輪のスリップや
粘性変化等を吸収することができる。
【0101】なお、上記各実施例では、キネマティクス
部20やダイナミクス部21に与えるそれぞれの条件と
して、位置x、y、車体角θ、速度v、角速度ω、右車
輪駆動トルクτr 、左車輪駆動トルクτl などを入力す
る場合を例示したが、他のパラメータを追加したり、置
き換えたりしてもよいことはもちろんである。また、既
知構造部22についても、自由に追加変更が可能であ
り、ニューラルネットワークの適用目的によって自由に
構築可能である。
【0102】以上説明してきたように、この発明の自律
移動ロボット運動制御装置によれば、ニューラルネット
ワークの単位回路をダイナミクス部とキネマティクス部
のモジュール構造にすることにより、それぞれを別々に
学習することを可能とし、少ない訓練パターン数と訓練
回数により、効率の良い、かつ正確な学習を行うことを
可能にすることができる。
【0103】また、制御対象の既知特性を神経回路に取
り込むことにより、学習の効率化と走行コースの生成時
の汎化能力の改善を達成できる。また、学習済の神経回
路とトルク変化最小基準を評価関数として用いることに
より、初期値と目標点のみを与えた場合の走行コースお
よび障害物回避も滑らかな軌道で実現できる。
【0104】
【発明の効果】以上述べたように、この発明の自律移動
ロボット走行制御装置では、移動ロボットの動特性の学
習はダイナミクス部で、移動ロボットの軌道特性の学習
はキネマティクス部で、それぞれ独立に行うようにした
ので、ダイナミクスの学習もキネマティクスの学習も同
一の処理部で処理していた従来のパーセプトロン型ニュ
ーラルネットワークに比べて、学習回数を大幅に低減で
きると共に、学習の早期収束を可能にすることができ
た。また、既知構造部をニューラルネットワークに組み
込むことで、ニューラルネットワークのユニット間結合
を低減し、汎化性を高めた構造を実現でき、学習に続く
走行コース生成を少ない学習データで円滑に実現できる
効果がある。
【図面の簡単な説明】
【図1】本発明の第一実施例に係る自律移動ロボット走
行制御装置のブロック図である。
【図2】本発明の第二実施例に係るニューラルネットワ
ークの構造を示すブロック図である。
【図3】本発明の第三実施例に係る自律移動ロボット走
行制御装置の学習モードを示すブロック図である。
【図4】本発明の第三実施例に係る自律移動ロボット走
行制御装置の軌道生成モードを示すブロック図である。
【図5】カスケードニューラルネットワークを用いた自
律移動ロボット走行制御装置のブロック図である。
【図6】学習用およびテスト用走行データの説明図であ
る。
【図7】走行パターンA4の場合の学習結果の説明図で
ある。
【図8】走行パターンC6の場合の学習結果の説明図で
ある。
【図9】走行コースの生成結果を示した図である。
【図10】走行パターンA4についての走行コース生成
結果を各要素ごとに示した図である。
【図11】走行パターンC6についての走行コース生成
結果を各要素ごとに示した図である。
【図12】障害物がある場合の走行コースの生成結果を
示した図である。
【図13】走行パターンA4について障害物がある場合
の走行コース生成結果を各要素ごとに示した図である。
【図14】走行パターンC6について障害物がある場合
の走行コース生成結果を各要素ごとに示した図である。
【図15】本発明の効果を示す学習収束曲線である。
【図16】本発明の自動車の無人運転への適用例を示す
ブロック図である。
【図17】自動車のヨー角の説明図である。
【図18】自動車の横変位量の説明図である。
【図19】本発明の第四実施例に係る自律移動ロボット
運動制御装置の部分ブロック図である。
【図20】移動ロボットの構成を示す概略構成図であ
る。
【図21】従来の自律移動ロボット走行制御装置のニュ
ーラルネットワークの概略構成図である。
【図22】従来構成における教師データの例を示す説明
図である。
【図23】従来構成における学習結果の例を示す説明図
である。
【図24】従来構成による、パターンA1についての各
要素毎の学習結果を示す説明図である。
【図25】従来構成による、パターンA5についての各
要素毎の学習結果を示す説明図である。
【符号の説明】
1 右車輪 2 左車輪 3 右車輪駆動モータ 4 左車輪駆動モータ 5 キャスター車輪 7 ニューラルネットワークキネマティクス補償部 8 変換部 9 ニューラルネットワークフィードバック誤差学習部 10 ロボットダイナミクス 11 ロボットキネマティクス 12 変換部 13 逆ダイナミクスモデル部 14 順キネマティクス・ダイナミクスモデル部 16 移動ロボット 17 入力層 18 中間層 19 出力層 20 キネマティクス部 21 ダイナミクス部 22 既知構造部 23 制御対象 24 上位モータセンタ 25 カスケードニューラルネットワーク 26 3層ニューラルネットワーク 27 既知構造ニューラルネットワーク

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 制御系の特性を学習するニューラルネッ
    トワークを備えた自律移動ロボット走行制御装置におい
    て、前記ニューラルネットワークは自律移動ロボットの
    軌道特性を学習するキネマティクス部と、自律移動ロボ
    ットの動特性を学習するダイナミクス部と、を含み、前
    記キネマティクス部および前記ダイナミクス部はそれぞ
    れ独立した処理部として構成されることを特徴とする自
    律移動ロボット走行制御装置。
  2. 【請求項2】 制御系の特性を学習するニューラルネッ
    トワークを備えた自律移動ロボット走行制御装置におい
    て、前記ニューラルネットワークは自律移動ロボットの
    既知特性を予め学習させた既知構造部を含むことを特徴
    とする自律移動ロボット走行制御装置。
  3. 【請求項3】 制御系の特性を学習するニューラルネッ
    トワークを備えた自律移動ロボット走行制御装置におい
    て、前記ニューラルネットワークは自律移動ロボットの
    軌道特性を学習するキネマティクス部と、自律移動ロボ
    ットの動特性を学習するダイナミクス部と、を含み、前
    記キネマティクス部および前記ダイナミクス部はそれぞ
    れ独立した処理部として構成され、前記キネマティクス
    部および前記ダイナミクス部の少なくとも一方が自律移
    動ロボットの既知特性を予め学習させた既知構造部を含
    むことを特徴とする自律移動ロボット走行制御装置。
JP5128825A 1993-05-31 1993-05-31 自律移動ロボット走行制御装置 Pending JPH06337713A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5128825A JPH06337713A (ja) 1993-05-31 1993-05-31 自律移動ロボット走行制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5128825A JPH06337713A (ja) 1993-05-31 1993-05-31 自律移動ロボット走行制御装置

Publications (1)

Publication Number Publication Date
JPH06337713A true JPH06337713A (ja) 1994-12-06

Family

ID=14994347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5128825A Pending JPH06337713A (ja) 1993-05-31 1993-05-31 自律移動ロボット走行制御装置

Country Status (1)

Country Link
JP (1) JPH06337713A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008280893A (ja) * 2007-05-09 2008-11-20 Toyota Motor Corp 内燃機関の燃料性状判定装置
JP2020135901A (ja) * 2019-02-22 2020-08-31 本田技研工業株式会社 移動ロボットの歩行者回避方策を実施するためのシステム及び方法
JP6815571B1 (ja) * 2020-02-27 2021-01-20 三菱電機株式会社 ロボット制御装置、ロボット制御方法及び学習モデル生成装置
KR102224693B1 (ko) * 2019-11-29 2021-03-08 브이아이씨테크 주식회사 제어 명령에 따른 이동체의 이동결과 추정을 위한 인공지능 모델 학습방법, 장치 및 프로그램

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008280893A (ja) * 2007-05-09 2008-11-20 Toyota Motor Corp 内燃機関の燃料性状判定装置
JP2020135901A (ja) * 2019-02-22 2020-08-31 本田技研工業株式会社 移動ロボットの歩行者回避方策を実施するためのシステム及び方法
JP2022009179A (ja) * 2019-02-22 2022-01-14 本田技研工業株式会社 移動ロボットの歩行者回避方策を実施するためのシステム及び方法
KR102224693B1 (ko) * 2019-11-29 2021-03-08 브이아이씨테크 주식회사 제어 명령에 따른 이동체의 이동결과 추정을 위한 인공지능 모델 학습방법, 장치 및 프로그램
JP6815571B1 (ja) * 2020-02-27 2021-01-20 三菱電機株式会社 ロボット制御装置、ロボット制御方法及び学習モデル生成装置
WO2021171500A1 (ja) * 2020-02-27 2021-09-02 三菱電機株式会社 ロボット制御装置、ロボット制御方法及び学習モデル生成装置

Similar Documents

Publication Publication Date Title
Tork et al. An adaptive modified neural lateral-longitudinal control system for path following of autonomous vehicles
CN109969181B (zh) 一种车道偏离辅助系统及其车道偏离辅助方法
Zadeh et al. Neural network and fuzzy logic applications to vehicle systems: literature survey
Velagic et al. Neural network controller for mobile robot motion control
Awad et al. Model predictive control with fuzzy logic switching for path tracking of autonomous vehicles
Boukens et al. Design of an intelligent optimal neural network-based tracking controller for nonholonomic mobile robot systems
CN111624992A (zh) 一种基于神经网络的搬运机器人的路径跟踪控制方法
Park et al. Robust adaptive formation control and collision avoidance for electrically driven non-holonomic mobile robots
Singh et al. Intelligent neuro-controller for navigation of mobile robot
CN115303289A (zh) 一种基于深度高斯车辆动力学模型、训练方法、智能汽车轨迹跟踪控制方法及终端设备
CN113064424A (zh) 一种改进ddpg算法的无人车路径规划方法
Cardenas et al. Autonomous motion of mobile robot using fuzzy-neural networks
JPH06337713A (ja) 自律移動ロボット走行制御装置
JPH07110712A (ja) 操舵角制御装置
Bogosyan et al. Zero-Sum Game (ZSG) based integral reinforcement learning for trajectory tracking control of autonomous smart car
Velagic et al. Nonlinear motion control of mobile robot dynamic model
Chen et al. A crash avoidance system based upon the cockroach escape response circuit
Omatu et al. PID control of speed and torque of electric vehicle
Lacevic et al. Evolutionary design of fuzzy logic based position controller for mobile robot
Lacevic et al. Design of fuzzy logic based mobile robot position controller using genetic algorithm
Chen et al. The study on path tracking control method based on fuzzy-CMAC for autonomous vehicle in rural environment
Celemin et al. Teaching agents with corrective human feedback for challenging problems
JPH0254304A (ja) 非線形システム学習制御装置
Jennan et al. Neural networks based on fast terminal sliding mode lateral control for autonomous vehicle
Moran et al. Autonomous parking of vehicles with intelligent fuzzy-neural networks