JP2929538B2 - 非線形システム学習制御装置 - Google Patents

非線形システム学習制御装置

Info

Publication number
JP2929538B2
JP2929538B2 JP20654088A JP20654088A JP2929538B2 JP 2929538 B2 JP2929538 B2 JP 2929538B2 JP 20654088 A JP20654088 A JP 20654088A JP 20654088 A JP20654088 A JP 20654088A JP 2929538 B2 JP2929538 B2 JP 2929538B2
Authority
JP
Japan
Prior art keywords
signal
control
feedback
target trajectory
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20654088A
Other languages
English (en)
Other versions
JPH0254304A (ja
Inventor
光男 川人
良次 鈴木
徹 瀬戸山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU SHICHOKAKU KIKO KENKYUSHO KK
Original Assignee
EI TEI AARU SHICHOKAKU KIKO KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU SHICHOKAKU KIKO KENKYUSHO KK filed Critical EI TEI AARU SHICHOKAKU KIKO KENKYUSHO KK
Priority to JP20654088A priority Critical patent/JP2929538B2/ja
Publication of JPH0254304A publication Critical patent/JPH0254304A/ja
Application granted granted Critical
Publication of JP2929538B2 publication Critical patent/JP2929538B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は非線形システム学習制御装置に関し、たと
えばロボットや発電プラントや自動車エンジンなとの非
線形性を持ったシステムを適応的に学習制御するための
非線形システム学習制御装置に関する。
[従来の技術] 多関節型のマニピュレータはその構造上の特徴によ
り、姿勢により慣性モーメントが変化するなど非線形性
が強い。また、関節間に干渉があるため、アクチュエー
タのトルクが他の関節にも影響を与え、遠心力やコリオ
リ力といった速度の2乗に比例する力が働くなどの理由
から、その制御は一般に難しい。しかし、現在の商業用
マニピュレータの多くは局所的に設計されたフィードバ
ックループによるPID制御で動かされている。これは、
減速比の大きい電動機を用いることにより、アクチュエ
ータの慣性がマニピュレータの本体のそれに比べて相対
的に大きくなるため、マニピュレータの非線形性や関節
間の干渉を無視し得るからである。
それでも高速動作の場合やダイレクトドライブ型のマ
ニピュレータの場合などにはこれらの影響を無視するこ
とはできず、何らかの形で補償してやらなければならな
い。
[発明が解決しようとする課題] 近年、モデル参照型適応制御や、制御対象のダイナミ
ックスから直接制御に必要な制御量を計算するComputed
torque法などが提案されている。しかし、モデル参照
型適応制御は、その適用範囲が限られており、またロバ
ストでない。すなわち、制御対象の実際の特性が、制御
システム設計の際に想定したモデルと多少食違っても制
御性をあまり損わない制御を行なうことができない。ま
た、Computed torque法は、厳密な制御対象モデリング
とパラメータ推定に基づく前向き制御であるが、良いモ
デルを立てることと精密なパラメータ推定は、実際には
非常に困難である。さらに、繰返し学習方式が提案され
ているが、これは或る特定の制御の時間パターンで得ら
れた経験が他のパターンには使えないという欠点があっ
た。
それゆえに、この発明に主たる目的は、高精度で適用
範囲が広く、ロバストで厳密なモデリングやパラメータ
推定を必要とせず、かつ或る制御パターンで得られた経
験が全く異なる状況でも役に立つような非線形システム
学習制御装置を提供することである。
[課題を解決するための手段] この発明は、目標軌道に応じて、非線形の制御対象を
制御するための非線形システム学習制御装置であって、
目標軌道信号と制御対象からのフィードバック信号とに
基づいて、目標軌道と実際の軌道との差にフィードバッ
クゲインをかけたフィードバック運動指令を演算する演
算手段と、目標軌道信号から逆ダイナミクスモデルを生
成するための信号を発生する手段と、少なくとも入力層
と出力層とを含み、逆ダイナミクスモデルを生成するた
めの信号と目標軌道信号とが組合わされて入力されると
ともに、演算手段によって演算されたフィードバック運
動を示す信号が誤算信号として入力され、その誤差信号
によってシナプス荷重を変化させて目標軌道信号からフ
ィードフォワード運動指令を演算する多層学習神経回路
と、演算されたフィードバック運動指令と多層学習神経
回路から出力されたフィードフォワード運動指令とを加
算して、制御対象を制御する手段とを備えて構成され
る。
[作用] この発明に係る非線形システム学習制御装置は、フィ
ードバックループにより非線形の制御対象をほぼ目標の
時間経過どおりに制御するとともに、フィードバック指
令を誤差信号としてシナプス荷重を変化させるようにし
たので、従来方式に比べて高精度で適用範囲が広く、ロ
バストで厳密なモデリングやパラメータ推定を必要とせ
ず、かつある制御パターンで得られた経験が全く異なる
状況でも役に立たせることができる。
[発明の実施例] 第1図はこの発明の一実施例を示すブロック図であ
る。
第1図において、目標軌道信号θd1d2…θdNは減
算回路1に与えられ、減算回路1によってフィートバッ
クループ3からフィードバックされたフィードバック信
号θ1…θと加算されて演算部2に与えられる。
演算部2は目標軌道と実際の軌道との差にフィードバッ
クゲインKをかけてフィードバックトルクTf1,Tf2…TfN
を計算して出力する。
前述の目標軌道信号θd1d2…θdNは微分回路6に
よって微分され、微分信号θd1,d1d1が逆ダイナ
ミックスモデルとしての多層神経回路7に与えられる。
多層神経回路7は複数の入力層と複数の中間層と複数の
出力層を含んで構成される。そして、多層神経回路7は
目標軌道の1階または2階の時間微分から制御に必要な
フィードフォワードトルクTi1,Ti2…TiNを計算して加算
回路4に出力する。加算回路4は演算部2によって演算
されたフィードバックトルクTf1,Tf2…TfNとフィードフ
ォワードトルクTi1,Ti2…TiNを加算してマニピュレータ
5に与える。なお、フィードバックトルクTf1,Tf2…TfN
は誤差信号として多層神経回路7の出力層にも与えられ
ている。マニピュレータ5は制御対象となるロボットで
あって、実際の軌道θ1…θを出力するととも
に、フィードバックループ3を介して前述の減算回路1
にフィードバックする。
次に、この発明の一実施例の動作について説明する。
目標軌道信号θd1d2…θdNが与えられると、学習前
には第1図におけるフィードバックループ3を介してフ
ィードバックされたフィードバック信号θ1…θ
と目標軌道信号θd1d2…θdNとに基づいて制御が行
なわれる。学習が進むに従って、多層神経回路7のシナ
プス伝達効率が変化し、制御対象の逆ダイナミックスモ
デルが徐々に形成される。学習の最終段階では、ほぼ完
全な逆ダイナミックスモデルが獲得され、制御は多層神
経回路7を通る前向き経路にほとんど依存する。このと
き、実現された軌道は目標軌道にほぼ一致する。
次に、多層神経回路7の各ニューロンの特性について
説明する。各ニューロンは、多数の入力信号をシナプス
加重で重みづけして足し併せる線形加重の操作と、その
結果得られる膜電位をシグモイド型の非線形関数で変換
して出力とする操作の2つを同時に行なう。
ここで、多層神経回路7のモデルのシナプス学習につ
いて説明する。制御対象となるマニピュレータ5には、
ネガティブフィードバックによる制御信号Tfと内部モデ
ルによる制御信号Tiの和Tが加えられる。ここで、入力
層と中間層の間のシナプス加重をW1 ijとし、中間層と出
力層の間の加重をW2 jkとし、ニューロンの入力と出力を
それぞれxi,yiとし、i,h,oはそれぞれ入力層,中間層お
よび出力層であることを示すものとする。すると、 となり、各ニューロンの入出力関係は、 yi i=xi i yh j=f(Xh j) y0 k=f(X0 k) ここで、f(X)はシグモイド型の単調増加連続関数
で f(X)=2/(1+exp(−X))−1 である。多層神経回路7からの出力Tikはy0 kの定数倍と
する。
ネットワークの学習は、シナプス加重を変化させるこ
とにより行なわれる。シナプス加重を次式に従って変化
させる。
dw2 jk=−Tfk+yh j・f′(y0 k) =−Tfk・yh j・(1−y0 k 2)/2 Δwn(t)=ε・dwn(t)+α・Δwn(t−1) wn(t+1)=γwn(t)+Δwn(t) (n=1,2) 但し、tは加重を変化させた回数であり、ε,α,γ
は定数である。
第2図はこの発明の一実施例による産業用マニピュレ
ータロボットの学習制御方式の実験結果の一例を示す図
であって、それぞれ横軸は学習時間を示し、縦軸は第1,
第2,第3軸の関節角度で表わした目標軌道と実際の軌道
とを引算してそれを2乗して時間平均をとった平均2乗
誤差を示している。そして、2つの実線は訓練パターン
に対する結果を示し、1点鎖線はより速くて異なるテス
トパターンを示し、2点鎖線は遅くて異なるテストパタ
ーンに関する結果を示している。この第2図から明らか
なように、学習を開始してから約70分で平均2乗誤差の
少なくなっていることが明らかである。
[発明の効果] 以上のように、この発明によれば、フィードバックル
ープからのフィードバック指令を誤差信号としてシナプ
ス加重を適応的に変化させる多層学習神経回路を設けた
ことによって、従来方式に比べて高精度で適用範囲が広
く、ロバストであり厳密なモデリングやパラメータの推
定を必要とせず、かつ或る制御パターンで得られた経験
が全く異なる状況でも役に立つなどの性能向上を制御シ
ステム一般にもたらすことが期待できる。
【図面の簡単な説明】
第1図はこの発明の一実施例のブロック図である。第2
図はこの発明の一実施例の実験結果を示す図である。 図において、1は減算回路,4は加算回路、2は演算部、
3はフィードバックループ、5はマニピュレータ、6は
微分回路、7は多層神経回路を示す。
フロントページの続き (72)発明者 鈴木 良次 東京都文京区本郷7丁目3番地1号 東 京大学工学部計数工学科内 (72)発明者 瀬戸山 徹 大阪府豊中市待兼山町1丁目1番地 大 阪大学基礎工学部生物工学科内 (56)参考文献 特開 昭60−263206(JP,A) 特開 昭63−214801(JP,A) 富士通株式会社「FUJITSU」 (1988.6.10)オーム社、P.175− 184 電子通信学会技術研究報告、86、 [353](昭62−2−20)、電子通信学 会、宮本弘之・川人光男・鈴木良次、中 枢神経系モデルに基づく産業用マニピュ レータの階層学習制御、p.25−32 日本ロボット学会誌、4[2](昭61 −4)、日本ロボット学会、川人光男、 随意運動制御における適応と学習、p. 184−193 電子情報通信学会技術研究報告、87、 [428]第233頁〜240頁(昭63−3−26) (NBE87−133論文) Biological Cybern etics 57[3]第169頁〜185頁 (1987)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】目標軌道に応じて、非線形の制御対象を制
    御するための非線形システム学習制御装置であって、 前記目標軌道信号と前記制御対象からのフィードバック
    信号とに基づいて、目標軌道と実際の軌道との差にフィ
    ードバックゲインをかけたフィードバック運動指令を演
    算する演算手段、 前記目標軌道信号から逆ダイナミクスモデルを生成する
    ための信号を発生する手段、 少なくとも入力層と出力層とを含み、前記逆ダイナミク
    スモデルを生成するための信号と前記目標軌道信号とが
    組合わされて入力されるとともに、前記演算手段によっ
    て演算されたフィードバック運動を示す信号が誤差信号
    として入力され、その誤差信号によってシナプス荷重を
    変化させて前記目標軌道信号からフィードフォワード運
    動指令を演算する多層学習神経回路、および 前記演算手段によって演算されたフィードバック運動指
    令と前記多層学習神経回路から出力されたフィードフォ
    ワード運動指令とを加算して、前記制御対象を制御する
    手段とを備えた、非線形システム学習制御装置。
JP20654088A 1988-08-19 1988-08-19 非線形システム学習制御装置 Expired - Fee Related JP2929538B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20654088A JP2929538B2 (ja) 1988-08-19 1988-08-19 非線形システム学習制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20654088A JP2929538B2 (ja) 1988-08-19 1988-08-19 非線形システム学習制御装置

Publications (2)

Publication Number Publication Date
JPH0254304A JPH0254304A (ja) 1990-02-23
JP2929538B2 true JP2929538B2 (ja) 1999-08-03

Family

ID=16525067

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20654088A Expired - Fee Related JP2929538B2 (ja) 1988-08-19 1988-08-19 非線形システム学習制御装置

Country Status (1)

Country Link
JP (1) JP2929538B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5253039A (en) * 1990-10-19 1993-10-12 Kawasaki Steel Corporation Process and apparatus for measuring sizes of steel sections
WO2007049412A1 (ja) * 2005-10-27 2007-05-03 Yamaguchi University 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム
JP5191738B2 (ja) * 2006-03-24 2013-05-08 パナソニック株式会社 マニピュレータの制御方法および制御システム
US11539292B2 (en) 2018-02-16 2022-12-27 Mitsubishi Electric Corporation Power converter control device with feedforward

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60263206A (ja) * 1984-06-11 1985-12-26 Nissan Motor Co Ltd マニピユレ−タの制御装置
JPS63214801A (ja) * 1987-03-04 1988-09-07 Mitsubishi Heavy Ind Ltd ロバスト制御装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Biological Cybernetics 57[3]第169頁〜185頁(1987)
富士通株式会社「FUJITSU」(1988.6.10)オーム社、P.175−184
日本ロボット学会誌、4[2](昭61−4)、日本ロボット学会、川人光男、随意運動制御における適応と学習、p.184−193
電子情報通信学会技術研究報告、87、[428]第233頁〜240頁(昭63−3−26)(NBE87−133論文)
電子通信学会技術研究報告、86、[353](昭62−2−20)、電子通信学会、宮本弘之・川人光男・鈴木良次、中枢神経系モデルに基づく産業用マニピュレータの階層学習制御、p.25−32

Also Published As

Publication number Publication date
JPH0254304A (ja) 1990-02-23

Similar Documents

Publication Publication Date Title
JP2676397B2 (ja) 動的システムの運動軌道生成方法
KR101706367B1 (ko) 과소작동기를 갖는 자율무인 이동체의 신경회로망 기반 결함포용 컨트롤 방법
CN111650832B (zh) 一种水下多足步行机器人机械足姿态跟踪控制方法
JP3436320B2 (ja) 非線形システムの出力軌道と動特性の制御方法および装置
Rigatos Model-based and model-free control of flexible-link robots: A comparison between representative methods
Tian et al. Constrained motion control of flexible robot manipulators based on recurrent neural networks
Moarref et al. Mechatronic design and position control of a novel ball and plate system
CN115990888A (zh) 一种具有死区和时变约束功能的机械臂控制方法
JP2929538B2 (ja) 非線形システム学習制御装置
Kawaharazuka et al. Task-specific self-body controller acquisition by musculoskeletal humanoids: Application to pedal control in autonomous driving
Fouzia et al. Robust adaptive tracking control of manipulator arms with fuzzy neural networks
JP3105694B2 (ja) マニピュレータ制御方法
Wang et al. Trajectory tracking control for an underwater vehicle manipulator system using a neural-adaptive network
Wang et al. Self-adaptive neuro-fuzzy systems with fast parameter learning for autonomous underwater vehicle control
Saidi et al. Sliding Mode Control of a 2DOF Robot Manipulator: A Simulation Study Using Artificial Neural Networks with Minimum Parameter Learning
JPH0635525A (ja) ロボットアームの制御方法
Yoon et al. Assembly of low-stiffness parts through admittance control with adaptive stiffness
Varshney et al. Position tracking and balancing control of ball balancer system using intelligent controllers
Passold et al. Feedback error learning neural network applied to a scara robot
Shaheed et al. Adaptive inverse-dynamic and neuro-inverse-dynamic active vibration control of a single-link flexible manipulator
JP2008305064A (ja) 学習型制御装置および該方法
Pradhan et al. Fuzzy learning based adaptive control for a two-link flexible manipulator
Bhasin et al. Neural network control of a robot interacting with an uncertain Hunt-Crossley viscoelastic environment
Zhu et al. Research and modeling on self-tuning dynamic control system of flight simulator based on PID neural network
CN114888797B (zh) 一种基于参考轨迹实时修正的机器人轨迹跟踪控制方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees