JPH0254304A - 非線形システム学習制御装置 - Google Patents
非線形システム学習制御装置Info
- Publication number
- JPH0254304A JPH0254304A JP63206540A JP20654088A JPH0254304A JP H0254304 A JPH0254304 A JP H0254304A JP 63206540 A JP63206540 A JP 63206540A JP 20654088 A JP20654088 A JP 20654088A JP H0254304 A JPH0254304 A JP H0254304A
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- feedback
- signals
- torques
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001537 neural effect Effects 0.000 claims abstract description 15
- 230000000946 synaptic effect Effects 0.000 claims description 9
- 230000002411 adverse Effects 0.000 abstract 1
- 210000000225 synapse Anatomy 0.000 abstract 1
- 238000000034 method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000005062 synaptic transmission Effects 0.000 description 1
Landscapes
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
この発明は非線形システム学習制御装置に関し、たとえ
ばロボットや発電プラントや自動車エンジンなどの非線
形性を持ったシステムを適応的に学習制御するための非
線形システム学習制御装置に関する。
ばロボットや発電プラントや自動車エンジンなどの非線
形性を持ったシステムを適応的に学習制御するための非
線形システム学習制御装置に関する。
[従来の技術]
多関節型のマニピュレータはその構造上の特徴により、
姿勢により慣性モーメントが変化するなど非線形性が強
い。また、関節間に干渉があるため、アクチュエータの
トルクが他の関節にも影響を与え、遠心力やコリオリカ
といった速度の2乗に比例する力が働くなどの理由から
、その制御は一般に難しい。しかし、現在の産業用マニ
ピュレータの多くは局所的に設計されたフィードバック
ループによるPID制御で動かされている。これは、減
速比の大きい電動機を用いることにより、アクチュエー
タの慣性がマニピュレータの本体のそれに比べて相対的
に大きくなるため、マニピュレータの非線形性や関節間
の干渉を無視し得るからである。
姿勢により慣性モーメントが変化するなど非線形性が強
い。また、関節間に干渉があるため、アクチュエータの
トルクが他の関節にも影響を与え、遠心力やコリオリカ
といった速度の2乗に比例する力が働くなどの理由から
、その制御は一般に難しい。しかし、現在の産業用マニ
ピュレータの多くは局所的に設計されたフィードバック
ループによるPID制御で動かされている。これは、減
速比の大きい電動機を用いることにより、アクチュエー
タの慣性がマニピュレータの本体のそれに比べて相対的
に大きくなるため、マニピュレータの非線形性や関節間
の干渉を無視し得るからである。
それでも高速動作の場合やダイレクトドライブ型のマニ
ピュレータの場合などにはこれらの影響を無視すること
はできず、何らかの形で補償してやらなければならない
。
ピュレータの場合などにはこれらの影響を無視すること
はできず、何らかの形で補償してやらなければならない
。
[発明が解決しようとする課題]
近年、モデル参照型適応制御や、制御対象のダイナミッ
クスから直接制御に必要な制御量を計算するCompu
ted torque法などが提案されている。しか
し、モデル参照型適応制御は、その適用範囲が限られて
おり、またロバストでない。すなわち、制御対象の実際
の特性が、制御システム設計の際に想定したモデルと多
少食違っても制御性をあまり損わない制御を行なうこと
ができない。また、Computed torque
法は、厳密な制御対象モデリングとパラメータ推定に基
づく前向き制御であるが、良いモデルを立てることと精
密なパラメータ推定は、実際には非常に困難である。さ
らに、繰返し学習方式が提案されているが、これは成る
特定の制御の時間パターンで得られた経験が他のパター
ンには使えないという欠点があった。
クスから直接制御に必要な制御量を計算するCompu
ted torque法などが提案されている。しか
し、モデル参照型適応制御は、その適用範囲が限られて
おり、またロバストでない。すなわち、制御対象の実際
の特性が、制御システム設計の際に想定したモデルと多
少食違っても制御性をあまり損わない制御を行なうこと
ができない。また、Computed torque
法は、厳密な制御対象モデリングとパラメータ推定に基
づく前向き制御であるが、良いモデルを立てることと精
密なパラメータ推定は、実際には非常に困難である。さ
らに、繰返し学習方式が提案されているが、これは成る
特定の制御の時間パターンで得られた経験が他のパター
ンには使えないという欠点があった。
それゆえに、この発明の主たる目的は、高精度で適用範
囲が広く、ロバストで厳密なモデリングやパラメータ推
定を必要とせず、がっ成る制御パターンで得られた経験
が全く異なる状況でも役に立つような非線形システム学
習制御装置を提供することである。
囲が広く、ロバストで厳密なモデリングやパラメータ推
定を必要とせず、がっ成る制御パターンで得られた経験
が全く異なる状況でも役に立つような非線形システム学
習制御装置を提供することである。
[課題を解決するための手段]
この発明は非線形システム学習制御装置であって、非線
形の制御対象をほぼ目標の時間経過通りに制御するため
のフィードバックループと、フィードバックループがら
のフィードバック指令を誤差信号としてシナプス加重を
適応的に変化させる多層学習神経回路とを階層的に組合
わせて構成したものである。
形の制御対象をほぼ目標の時間経過通りに制御するため
のフィードバックループと、フィードバックループがら
のフィードバック指令を誤差信号としてシナプス加重を
適応的に変化させる多層学習神経回路とを階層的に組合
わせて構成したものである。
[作用]
この発明に係る非線形システム学習制御装置は、フィー
ドバックループにより非線形の制御対象をほぼ目標の時
間経過通りに制御するとともに、フィードバック指令を
誤差信号としてシナプス加重を適応的に変化させるよう
にしたので、従来方式に比べて高精度で適用範囲が広く
、ロバストで厳密なモデリングやパラメータ推定を必要
とせず、かつ成る制御パターンで得られた経験が全く異
なる状況でも役に立たせることができる。
ドバックループにより非線形の制御対象をほぼ目標の時
間経過通りに制御するとともに、フィードバック指令を
誤差信号としてシナプス加重を適応的に変化させるよう
にしたので、従来方式に比べて高精度で適用範囲が広く
、ロバストで厳密なモデリングやパラメータ推定を必要
とせず、かつ成る制御パターンで得られた経験が全く異
なる状況でも役に立たせることができる。
[発明の実施例コ
第1図はこの発明の一実施例を示すブロック図である。
第1図において、目標軌道信号θd++ θd2・・
・θdNは減算回路1に与えられ、減算回路1によって
フィードバックループ3からフィードバックされたフィ
ードバック信号θ1.θ2・・・θNと加算されて演算
部2に与えられる。演算部2は目標軌道と実際の軌道と
の差にフィードバックゲインKをかけてフィードバック
トルクTF + 、T4’2・・・Tp、を計算して出
力する。
・θdNは減算回路1に与えられ、減算回路1によって
フィードバックループ3からフィードバックされたフィ
ードバック信号θ1.θ2・・・θNと加算されて演算
部2に与えられる。演算部2は目標軌道と実際の軌道と
の差にフィードバックゲインKをかけてフィードバック
トルクTF + 、T4’2・・・Tp、を計算して出
力する。
前述の目標軌道信号θd++ θd2・・・θdNは
微分回路6によって微分され、微分信号θd++θd1
・・・θd、が逆ダイナミックスモデルとしての多層神
経回路7に与えられる。多層神経回路7は複数の入力層
と複数の中間層と複数の出力層を含んで構成される。そ
して、多層神経回路7は目標軌道の1階または2階の時
間微分から制御に必要なフィードフォワードトルクT+
++”r、2・・・T、Nを計算して加算回路4に出力
する。加算回路4は演算部2によって演算されたフィー
ドバックトルクTl’ + 、T# 2・・・Tpm
とフィードフォワードトルクT、、、T、2・・・T、
Nを加算してマニピュレータ5に与える。なお、フィー
ドバックトルクTf+、TF2・・・TFNは誤差信号
とし゛で多層神経回路7の出力層にも与えられている。
微分回路6によって微分され、微分信号θd++θd1
・・・θd、が逆ダイナミックスモデルとしての多層神
経回路7に与えられる。多層神経回路7は複数の入力層
と複数の中間層と複数の出力層を含んで構成される。そ
して、多層神経回路7は目標軌道の1階または2階の時
間微分から制御に必要なフィードフォワードトルクT+
++”r、2・・・T、Nを計算して加算回路4に出力
する。加算回路4は演算部2によって演算されたフィー
ドバックトルクTl’ + 、T# 2・・・Tpm
とフィードフォワードトルクT、、、T、2・・・T、
Nを加算してマニピュレータ5に与える。なお、フィー
ドバックトルクTf+、TF2・・・TFNは誤差信号
とし゛で多層神経回路7の出力層にも与えられている。
マニピュレータ5は制御対象となるロボットであって、
実際の軌道θ4.θ2・・・θKを出力するとともに1
.フィードバックループ3を介して前述の減算回路1に
フィードバックする。
実際の軌道θ4.θ2・・・θKを出力するとともに1
.フィードバックループ3を介して前述の減算回路1に
フィードバックする。
次に、この発明の一実施例の動作について説明する。目
標軌道信号θd++ θd2・・・θdNが与えられ
ると、学習前には第1図におけるフィードバックループ
3を介してフィードバックされたフィードバック信号θ
7.θ2・・・θHと目標軌道信号θd + + θ
d2・・・θdNとに基づいて制御が行なわれる。学習
が進むに従って、多層神経回路7のシナプス伝達効率が
変化し、制御対象の逆ダイナミックスモデルが徐々に形
成される。学習の最終段階では、はぼ完全な逆ダイナミ
ックスモデルが獲得され、制御は多層神経回路7を通る
前向き経路にほとんど依存する。このとき、実現された
軌道は目標軌道にほぼ一致する。
標軌道信号θd++ θd2・・・θdNが与えられ
ると、学習前には第1図におけるフィードバックループ
3を介してフィードバックされたフィードバック信号θ
7.θ2・・・θHと目標軌道信号θd + + θ
d2・・・θdNとに基づいて制御が行なわれる。学習
が進むに従って、多層神経回路7のシナプス伝達効率が
変化し、制御対象の逆ダイナミックスモデルが徐々に形
成される。学習の最終段階では、はぼ完全な逆ダイナミ
ックスモデルが獲得され、制御は多層神経回路7を通る
前向き経路にほとんど依存する。このとき、実現された
軌道は目標軌道にほぼ一致する。
次に、多層神経回路7の各ニューロンの特性について説
明する。各ニューロンは、多数の入力信号をシナプス加
重で重みづけして足し併せる線形加重の操作と、その結
果得られる膜電位をシグモイド型の非線形関数で変換し
て出力とする操作の2つを同時に行なう。
明する。各ニューロンは、多数の入力信号をシナプス加
重で重みづけして足し併せる線形加重の操作と、その結
果得られる膜電位をシグモイド型の非線形関数で変換し
て出力とする操作の2つを同時に行なう。
ここで、多層神経回路7のモデルのシナプス学習につい
て説明する。制御対象となるマニピュレータ5には、ネ
ガティブフィードバックによる制御信号TI:と内部モ
デルによる制御信号T、の和Tが加えられる。ここで、
入力層と中間層の間のシナプス加重をw’ 、 Jとし
、中間層と出力層の間の加重をw2.、とし、ニューロ
ンの人力と出力をそれぞれXi、YJ とし、i、
h、 oはそれぞれ人力層、中間層および出力層であ
ることを示すものとする。すると、 X 、−Σw’、、 ・y Xo、−ΣW24.・yh。
て説明する。制御対象となるマニピュレータ5には、ネ
ガティブフィードバックによる制御信号TI:と内部モ
デルによる制御信号T、の和Tが加えられる。ここで、
入力層と中間層の間のシナプス加重をw’ 、 Jとし
、中間層と出力層の間の加重をw2.、とし、ニューロ
ンの人力と出力をそれぞれXi、YJ とし、i、
h、 oはそれぞれ人力層、中間層および出力層であ
ることを示すものとする。すると、 X 、−Σw’、、 ・y Xo、−ΣW24.・yh。
となり、各ニューロンの入出力関係は、y +−X’
y’r−fcX”;)
Yo> −f (X’ y )
ここで、f (X)はシグモイド型の単調増加連続関数
で f (X)=2/ (1+exp (−X))−1であ
る。多層神経回路7からの出力T、、はyo、の定数倍
とする。
で f (X)=2/ (1+exp (−X))−1であ
る。多層神経回路7からの出力T、、はyo、の定数倍
とする。
ネットワークの学習は、シナプス加重を変化させること
により行なわれる。シナプス加重を次式に従って変化さ
せる。
により行なわれる。シナプス加重を次式に従って変化さ
せる。
d w’ 、、m−ΣTc、・f′ (yok )・
w2Jk ”Y’ l −f’ CY’; )−一Σ
T1−.・ (1y’i 2 )/に 2・W2jl −y’i ・ (1−y)12)/
2 dw2= k −TFk −YJ ” f′ (Yo
k)−m”ri、 争yh、 ・ (I V0
L2)/2 Δw’ (t)−e ・dw″ (t)+a ・Δw
″(t−1) w (t+1) −7w (t) +Δw
’(t)(n−1,2) 但し、tは加重を変化させた回数であり、ε、α。
w2Jk ”Y’ l −f’ CY’; )−一Σ
T1−.・ (1y’i 2 )/に 2・W2jl −y’i ・ (1−y)12)/
2 dw2= k −TFk −YJ ” f′ (Yo
k)−m”ri、 争yh、 ・ (I V0
L2)/2 Δw’ (t)−e ・dw″ (t)+a ・Δw
″(t−1) w (t+1) −7w (t) +Δw
’(t)(n−1,2) 但し、tは加重を変化させた回数であり、ε、α。
γは定数である。
第2図はこの発明の一実施例による産業用マニピュレー
タロボットの学習制御方式の実験結果の一例を示す図で
あって、それぞれ横軸は学習時間を示し、縦軸は第1.
第2.第3軸の関節角度で表わした11標軌道と実際の
軌道とを引算してそれを2乗して時間・10均をとった
平均2乗誤差を示している。そして、2つの実線は訓練
パターンに対する結果を示し、1点鎖線はより速くて異
なるテストパターンを示し、2点鎖線は遅くて異なるテ
ストパターンに関する結果を示している。この第2図か
ら明らかなように、学習を開始してから約70分で平均
2乗誤差の少な(なっていることが明らかである。
タロボットの学習制御方式の実験結果の一例を示す図で
あって、それぞれ横軸は学習時間を示し、縦軸は第1.
第2.第3軸の関節角度で表わした11標軌道と実際の
軌道とを引算してそれを2乗して時間・10均をとった
平均2乗誤差を示している。そして、2つの実線は訓練
パターンに対する結果を示し、1点鎖線はより速くて異
なるテストパターンを示し、2点鎖線は遅くて異なるテ
ストパターンに関する結果を示している。この第2図か
ら明らかなように、学習を開始してから約70分で平均
2乗誤差の少な(なっていることが明らかである。
[発明の効果]
以上のように、この発明によれば、フィードバックルー
プからのフィードバック指令を誤差信号としてシナプス
加重を適応的に変化させる多層学習神経回路を設けたこ
とによって、従来方式に比べて高精度で適用範囲が広く
、ロバストであり厳密なモデリングやパラメータの推定
を必要とせず、かつ成る制御パターンで得られた経験が
全く異なる状況でも役に立つなどの性能向上を制御シス
テム一般にもたらすことが期待できる。
プからのフィードバック指令を誤差信号としてシナプス
加重を適応的に変化させる多層学習神経回路を設けたこ
とによって、従来方式に比べて高精度で適用範囲が広く
、ロバストであり厳密なモデリングやパラメータの推定
を必要とせず、かつ成る制御パターンで得られた経験が
全く異なる状況でも役に立つなどの性能向上を制御シス
テム一般にもたらすことが期待できる。
第1図はこの発明の一実施例のブロック図である。第2
図はこの発明の一実施例の実験結果を示す図である。 図において、1は減算回路、4は加算回路、2は演算部
、3はフィードバックループ、5はマニピュレータ、6
は微分回路、7は多層神経回路を示す。 特許出願人 株式会社エイ・ティ・アールJに/、E
J
図はこの発明の一実施例の実験結果を示す図である。 図において、1は減算回路、4は加算回路、2は演算部
、3はフィードバックループ、5はマニピュレータ、6
は微分回路、7は多層神経回路を示す。 特許出願人 株式会社エイ・ティ・アールJに/、E
J
Claims (1)
- 非線形の制御対象をほぼ目標の時間経過通りに制御する
ためのフィードバックループと、前記フィードバックル
ープからのフィードバック指令を誤差信号としてシナプ
ス加重を適応的に変化させる多層学習神経回路とを備え
た、非線形システム学習制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20654088A JP2929538B2 (ja) | 1988-08-19 | 1988-08-19 | 非線形システム学習制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20654088A JP2929538B2 (ja) | 1988-08-19 | 1988-08-19 | 非線形システム学習制御装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0254304A true JPH0254304A (ja) | 1990-02-23 |
JP2929538B2 JP2929538B2 (ja) | 1999-08-03 |
Family
ID=16525067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20654088A Expired - Fee Related JP2929538B2 (ja) | 1988-08-19 | 1988-08-19 | 非線形システム学習制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2929538B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5253039A (en) * | 1990-10-19 | 1993-10-12 | Kawasaki Steel Corporation | Process and apparatus for measuring sizes of steel sections |
WO2007049412A1 (ja) * | 2005-10-27 | 2007-05-03 | Yamaguchi University | 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム |
JP5191738B2 (ja) * | 2006-03-24 | 2013-05-08 | パナソニック株式会社 | マニピュレータの制御方法および制御システム |
US11539292B2 (en) | 2018-02-16 | 2022-12-27 | Mitsubishi Electric Corporation | Power converter control device with feedforward |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60263206A (ja) * | 1984-06-11 | 1985-12-26 | Nissan Motor Co Ltd | マニピユレ−タの制御装置 |
JPS63214801A (ja) * | 1987-03-04 | 1988-09-07 | Mitsubishi Heavy Ind Ltd | ロバスト制御装置 |
-
1988
- 1988-08-19 JP JP20654088A patent/JP2929538B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60263206A (ja) * | 1984-06-11 | 1985-12-26 | Nissan Motor Co Ltd | マニピユレ−タの制御装置 |
JPS63214801A (ja) * | 1987-03-04 | 1988-09-07 | Mitsubishi Heavy Ind Ltd | ロバスト制御装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5253039A (en) * | 1990-10-19 | 1993-10-12 | Kawasaki Steel Corporation | Process and apparatus for measuring sizes of steel sections |
WO2007049412A1 (ja) * | 2005-10-27 | 2007-05-03 | Yamaguchi University | 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム |
JP4918682B2 (ja) * | 2005-10-27 | 2012-04-18 | 国立大学法人山口大学 | 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム |
JP5191738B2 (ja) * | 2006-03-24 | 2013-05-08 | パナソニック株式会社 | マニピュレータの制御方法および制御システム |
US11539292B2 (en) | 2018-02-16 | 2022-12-27 | Mitsubishi Electric Corporation | Power converter control device with feedforward |
Also Published As
Publication number | Publication date |
---|---|
JP2929538B2 (ja) | 1999-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ho et al. | Robust fuzzy tracking control for robotic manipulators | |
US4990838A (en) | Movement trajectory generating method of a dynamical system | |
Jouila et al. | An adaptive robust nonsingular fast terminal sliding mode controller based on wavelet neural network for a 2-DOF robotic arm | |
CN111650832B (zh) | 一种水下多足步行机器人机械足姿态跟踪控制方法 | |
GB2258742A (en) | "predictive control method and apparatus". | |
US20010044789A1 (en) | Neurointerface for human control of complex machinery | |
Zheng et al. | Model-free development of control systems for a multi-degree-of-freedom robot | |
US6000827A (en) | System identifying device and adaptive learning control device | |
Kumar et al. | Tracking control of redundant robot manipulators using RBF neural network and an adaptive bound on disturbances | |
Urrea et al. | Trajectory tracking control of a real redundant manipulator of the SCARA type | |
Yan et al. | Robot learning control based on recurrent neural network inverse model | |
JPH0254304A (ja) | 非線形システム学習制御装置 | |
JPH07319507A (ja) | ロボット制御装置 | |
Ak et al. | Three link robot control with fuzzy sliding mode controller based on RBF neural network | |
Venugopal et al. | An improved scheme for direct adaptive control of dynamical systems using backpropagation neural networks | |
Yildirim | Design of adaptive robot control system using recurrent neural network | |
Wu et al. | An adaptive neural network compensator for decoupling of dynamic effects of a macro-mini manipulator | |
Katić et al. | Connectionist approaches to the control of manipulation robots at the executive hierarchical level: An overview | |
Kiguchi et al. | Fuzzy selection of fuzzy-neuro robot force controllers in an unknown environment | |
Hu et al. | Real-time motion control of a nonholonomic mobile robot with unknown dynamics | |
JPH06337713A (ja) | 自律移動ロボット走行制御装置 | |
Singh et al. | Inverse Kinematics Solution of Programmable Universal Machine for Assembly (PUMA) Robot | |
Zhao et al. | Adaptive Variable Universe Fuzzy Sliding-Mode Control for Robot Manipulators With Model Uncertainty | |
Jennan et al. | Neural networks based on fast terminal sliding mode lateral control for autonomous vehicle | |
Ak et al. | Adaptive neural network based fuzzy sliding mode control of robot manipulator |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |