JPH02140803A - 学習制御方法 - Google Patents

学習制御方法

Info

Publication number
JPH02140803A
JPH02140803A JP29534188A JP29534188A JPH02140803A JP H02140803 A JPH02140803 A JP H02140803A JP 29534188 A JP29534188 A JP 29534188A JP 29534188 A JP29534188 A JP 29534188A JP H02140803 A JPH02140803 A JP H02140803A
Authority
JP
Japan
Prior art keywords
time
trial
control
controlled object
deviation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP29534188A
Other languages
English (en)
Other versions
JP2541166B2 (ja
Inventor
Yuji Nakamura
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Manufacturing Co Ltd filed Critical Yaskawa Electric Manufacturing Co Ltd
Priority to JP63295341A priority Critical patent/JP2541166B2/ja
Publication of JPH02140803A publication Critical patent/JPH02140803A/ja
Application granted granted Critical
Publication of JP2541166B2 publication Critical patent/JP2541166B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Control Of Position Or Direction (AREA)
  • Numerical Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、繰り返し動作をする工作機械、ロボット等に
おける学習制御方式に関する。
〔従来の技術〕
繰り返し目標値に対する制御系の設計法としては、例え
ば「陽子シンクロトロン電磁石電源の繰り返し運転にお
ける高精度制御」井上他、電気学会論文誌C,100巻
7号において提案されている方法がある。この方法は、
1周期前の制御入力及び1周期前の制御偏差を利用して
いる点が大きな特徴となっている。これによって高精度
な追従を可能として、さらに周期的な外乱を除去するな
どの利点を有している。
この手法は、目標値が同じパターンを断続的に繰り返す
場合にも適用可能で、その際の時刻tにおける制御入力
u (t)は、 u(t)= u(t’)+ e(t’)となる。ここで
t“は時刻tに対応する前回の試行時の時刻である。
また、未来の制御偏差の予測値の重み付き二乗和を最小
とする予測制御方式としては、本出順人が先に出願した
特開昭62−118405号公報記載の方式がある。
この方式は、現在サンプリング時刻iにふける制御入力
u (i)を増分制御入力を用いて、として与えている
。ここでサンプリング時刻iにおける増分制御入力m(
i)は、制御対象のインディシャル応答のサンプリング
値と過去の増・分制御入力と、現在の出力と未来の目標
値とから未来の制御偏差を予測し、その予測値の重み付
き2乗和が最小となるように決定される。
この方式は、未来の目標値を利用しているため、現在の
目標値のみを用いる制御系よりも良好な応答特性が得ら
れ、また簡単な四則演算によって実現可能であるという
利点を有している。
さらに、特開昭62−118406号公報においては、
同じパタンを繰り返す目標値に対して、前記の増分制御
入力に1試行前の制御偏差の定数倍を加えたものを、改
めて増分制御入力として与えることを特徴とするI試行
前の制御偏差を利用した予測制御方式が提案されている
〔発明が解決しようとする課題〕
しかしながら、繰り返し目標値に対する上述の設計法、
すなわち繰り返し制御方式及び特開昭62−11840
6号公報のいずれにおいても、時刻Iにおける制御入力
u k(i)を決定する際に、前回の偏差em−+(i
)を利用しており、制御対象の動特性による動作の遅れ
及びむだ時間を考慮していない。
また、前記の「陽子シンクロトロン電磁石電源の繰り返
し運転における高精度制御」に記載された方法では、そ
れらの伝達関数が必要である。
そこで本発明では、制御対象の伝達関数を求めるような
手間を必要とせずに、従来よりも収束性及び安定性に優
れた学習制御装置を実現することを目的とする。
〔課題を解決するための手段及び作用〕この目的を達成
するため、本願の第1の発明の学習制御方式は、同じパ
タンを連続的あるいは断続的に繰り返す目標値に制御対
象の出力を一致させるよう制御入力を加える制御系にお
いて、k回目の試行でのサンプリング時刻1における制
御入力u 、 (i)を uk(i)= g 1・eh(+) +g2σk(i)
σ、C皿) = σk −、(i) + (em−1(i+CN)+ ek−+(i+c2)
+・・・・+em−+(+十c*))  / N ここで、eh(i):に回目の試行での時刻lにおける
制御偏差 σm(+):に回目の試行での時刻lにおける修正量 g+1g2:適当な正の定数 C3〜C,1,: C+ <[:2<C,・・・・<C
1,であるN個の適当な整数 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek−1(リー eb(J−3)          
 j >  Sである。
とすることを特徴とする。
この発明においては、位置の偏差値e w (+)と修
正量σ−(i)とを重み付けして加算したものを制御入
力u k(i)とする。この修正量修正量σk(i)は
、前回の試行での時刻lにおける修正量σに−1(i)
に、前回の試行での制御偏差のいつくかの未来値の平均
値を加えたものとする。このように、前回の制御偏差を
利用する際に、制御対象の遅れ分だけ後の偏差を用い、
さらにそれら数ステップ分を平均化して利用することに
より、むだ時間要素を含む制御対象に対して、収束性及
び安定性に優れた学習制御を実現することができる。
また、本願の第2の発明の学習制御方式は、同じパタン
を連続的あるいは断続的に繰り返す目標値に制御対象の
出力を一致させるよう制御入力を加える制御系において
、 k回目の試行でのサンプリング時刻lにおける制御入力
u = (i)を u k(i) = g + ・a k(i) + g 
2σ−(i)σ−(i)−σm−+(i)十ha ek
−+(i)+ h+ eb−+(++1)+・・・・十
h ++ e k−+ (++N)ここで、ek(り二
に回目の試行での時刻lにおける制御偏差 σi、(i):に回目の試行での時刻iにおける修正量 g+9g2’適当な正の定数 h0〜h、二制御対象のステップ応答 のサンプル値の差分値。
あるいはインパルス応答 のサンプル値 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合にはek−+0)−eb(J−
3)        j  > Sである。
とすることを特徴とする。
この第2の発明では、修正量σk(i)として、前回の
試行での時刻Iにおける修正Mσに−+(+)に、ステ
ップ応答の各サンプリング時刻における差分値と前回の
試行での制御偏差の未来値とを乗じたものを加えている
ため、制御対象の遅れ分だけ後の偏差が考慮され、学習
制御系の収束性及び安定性が向上する。
〔実施例〕
以下、本発明を具体的に説明する。
本願の第1の発明に対応する実施例を第1図に示す。そ
の際の制御計算のフローチャートを第2図に、さらに制
御対象のステップ応答を第3図に示す。ここでの制御対
象とは、その内部に既に従来の制御ループが組まれてい
ても差し支えない。
図中1は指令発生器であり、同じパタン(r (0) 
r(i)、・・・・ r (i、h−) )を繰り返し
発生する。2は減算器、3.4.5は各々ゲインがg 
+1g 2.1/3の乗算器である。乗算器5のゲイン
は、後述する(i)式においてN = 3として3つの
制御偏差の平均をとるために、1/3 に設定している
。6は加算器、7は修正量(σ(0)、σ(i)、・・
・・、σ(i、h−) )を記憶するためのメモリであ
る。
8は積算器、9,10はサンプリング周期Tで閉じるサ
ンプラで、11はホールド回路である。また、I2はロ
ーパスフィルタ、13は制御対象である。
いま、k回目の試行でのサンプリング時刻iにおける制
御入力u k(i)を ここで、et、(i)二に回目の試行での時刻lにおけ
る制御偏差 σk(i):に回目の試行での時刻lにおける修正量 gI、g2:適当な正の定数 として与えることとする。
この(i)式の第1式は、位置の偏差値e k(i)と
修正量σ、(i〕 とを重み付けして加算したものを制
御入力u k(i)とすることを意味している。また、
(i)式の第2式は、今回の試行での時刻lにおける修
正量σk(i)を、前回の試行での時刻lにおける修正
量σ−,−,(i)に、前回の試行での制御偏差のいつ
くかの未来値の平均値を加えたものとすることを意味し
ている。
時刻iにおける入力u k(i)の影響は、制御対象の
遅れ分だけ後の偏差ek(i+cl)〜e++(++C
++)に現れてくるため、(i)式で表される制御入力
の修正を行うことにより、むだ時間に対する学習制御の
特性が改善される。
なお、目標値が連続的であり、その1周期分のサンプリ
ング数がSである場合には ek−1(」)−ek(J−3)j>S・・・・・・(
2)である。
たとえば、S =100. N =5.Δ=3のとき、
C11、[:、 = 2.C3−3,C,= 4.C5
= 5とすると、k回目の試行での時刻98における修
正量σk(9B)  は、σk(98) −ffk−1
(9a)+  (ek−+(99)+ ek−+(i0
0)+eh(i)+ eh(2)+ ek(3)]  
15となる。つまり、偏差を利用する際に数ステップ後
の値を利用するため、試行の後半部では、前回の試行で
はなく今回の試行における偏差が必要となってくる。そ
こで、(2)式の関係式に基づいて制御偏差を表す。
第3図のステップ応答を例にとると、制御対象のステッ
プ応答の差分の最大値は、時刻4Tにおけるh4である
そこで、サンプリング時刻i + C+とi+C,との
中間時刻が1+4となるように、さらにN=3とし、 (C,、C2,C,)  −(3,4,5)と選ぶと、
(i)式は となる。これは第2図のフローチャートにより算出され
る。
第3図のステップ応答の差分が最大値をとる時刻では、
同じ制御対象のインパルス応答は最大値をとると言える
ので、インパルス応答が最大値をとる時刻Δを求め、時
刻i+[’、とi+CNとの中間時刻+”(Cs”C+
)/2 がi+Δとなるように整数[:l+ C2+・
・・・、CM を決定することができる。
次に、本願の第2の発明の実施例を第4図に、制御計算
のフローチャートを第5図に示す。
図中21は指令発生器であり、同じパクン(r (0)
 。
r (i)、・・・・、 r (i、、、) )を1試
行ごとに繰り返し発生する。22は減算器、23.24
.25は各々ゲインがg++ gi+ ho、 h、、
e++、 h* の乗算器である。26は加算器、27
は1試行分の修正量(σ(0)、σ(i)、・・・・、
σ(i、、d) )を記憶するためのメモリである。
28は積算器、29.30はサンプラであり、31はホ
ールド回路である。32はローパスフィルタ、33は制
御対象である。
ここでの制御対象とは、その内部に既に従来の制御ルー
プが組まれていても差し支えない。
いま、制御対象33のステップ応答のサンプル値の差分
が第6図に示すように(ho、h、、・・・、 h、)
であるとすると、第5図に示したフローチャートに従え
ば、k回目の試行でのサンプリング時刻1における制御
入力u k(i)は、 uk(+)−g+’ eh(i)+ gxσk(i)σ
k(D= σt+−+に)十L ek−+(i)+ h
l ek−+(i+1)+”+hHah−+(++N) ここで、ek(i):に回目の試行での時刻iにおける
制御偏差 σk(+):に回目の試行での時刻iにおける修正量 g+、gx:適当な正の定数 h0〜h、;制御対象のステップ応答 のサンプル値の差分値。
あるいはインパルス応答 のサンプル値 として与えられる。
この(4)式の第1式は、位置の偏差値e k (i)
と修正量σk (i)とを重み付けして加算したものを
制御入力u k(i)とすることを意味している。また
、(4)式の第2式は、今回の試行での時刻1における
修正量σk(i)を、前回の試行での時刻iにおける修
正量σ、、(i)と、制御対象のステップ応答のサンプ
ル値の差分値(第6図参照)に各サンプリング時刻にお
ける制御偏差の未来値を乗じたものを加えたものとする
ことを意味している。
入力の影響は制御対象の遅れ分だけ後の偏差に現れ、さ
らにその影響の度合いはステップ応答の差分値に比例す
るため、(4)式で表される制御入力の修正を行うこと
により、むだ時間に対する学習制御の特性が改善される
なお、定常偏差が現れる場合には、学習制御器の出力u
 k(i)を積算器に通したものを制御入力として制御
対象に加えることができる。
また、充分な繰り返しを経て制御偏差が希望する値以下
に収束した後は、学習が完了したことになるたt、メモ
リに記憶されているl試行分の修正量σを用いて、制御
入力u −(i)を、u k(i) = g + ・e
 k(+) + g 26 (i)として与えることが
できる。このときは、修正量σ(i)の計算は不必要と
なる。
〔発明の効果〕
以上に述べたように、本発明においては、前回の制御偏
差を利用する際に、制御対象の遅れ分だけ後の偏差を用
いて、さらにそれら数ステップ分を平均化して利用する
か、あるいは制御対象の遅れをステップ応答の差分値と
いう形で利用している。このように、本発明では制御対
象の遅れを考慮しているため、制御対象の伝達関数を求
めるような手間を必要とせずに、従来よりも収束性及び
安定性に優れた学習制御方式を実現することができる。
【図面の簡単な説明】
第1図は本願の第1の発明の実施例を示すブロック図、
第2図は第1の発明における制御計算のフローチャート
、第3図は制御対象のステップ応答の特性図、第4図は
本願の第2の発明の実施例を示すブロック図、第5図は
第2の発明における制御計算のフローチャート、第6図
は制御対象のステップ応答の特性図である。 1:指令発生器    2:減算器 3.4,5:乗算器  6:加算器 7:メモリ       8:積算器

Claims (6)

    【特許請求の範囲】
  1.  1.同じパタンを連続的あるいは断続的に繰り返す目
    標値に制御対象の出力を一致させるよう制御入力を加え
    る制御系において、 k回目の試行でのサンプリング時刻iにおける制御入力
    u_k(i)を u_k(i)=g_1・e_k(i)+g_2σ_k(
    i)σ_k(i)=σ_k_−_1(i) +{e_k_−_1(i+C_1)+e_k_−_1(
    i+C_2)+・・・・+e_k_−_1(i+C_N
    )}/N ここで、e_k(i):k回目の試行での時刻iにおけ
    る制御偏差 σ_k(i):k回目の試行での時刻iにおける修正量 g_1,g_2:適当な正の定数 C_1〜C_N:C_1<C_2<C_3・・・・<C
    _NであるN個の適当な整数 ただし、目標値が連続的であり、その1周 期分のサンプリング数がSである場合には e_k_−_1(j)=e_k(j−S)j>Sである
    。 とすることを特徴とする学習制御方式。
  2.  2.制御対象のステップ応答を測定して、ステップ指
    令開始時刻から、ステップ応答の差分値が最大となる時
    刻までのサンプリング数Δを求め、時刻i+C_1とi
    +C_Nとの中間時刻i+(C_N+C_1)/2がi
    +Δとなるように整数C_1,C_2,・・・・,C_
    Nを決定することを特徴とする請求項1記載の学習制御
    方式。
  3.  3.制御対象のインパルス応答を測定して、そのイン
    パルス応答が最大値をとる時刻Δを求め、時刻i+C_
    1とi+C_Nとの中間時刻i+(C_N+C_1)/
    2がi+Δとなるように整数C_1,C_2,・・・・
    ,C_Nを決定することを特徴とする請求項1記載の学
    習制御方式。
  4.  4.同じパタンを連続的あるいは断続的に繰り返す目
    標値に制御対象の出力を一致させるよう制御入力を加え
    る制御系において、 k回目の試行でのサンプリング時刻iにおける制御入力
    u_k(i)を u_k(i)=g_1・e_k(i)+g_2σ_k(
    i)σ_k(i)=σ_k_−_1(i)+h_0e_
    k_−_1(i)+h_1e_k_−_1(i+l) 
    +・・・・+h_Ne_k_−_1(i+N)ここで、
    e_k(i):k回目の試行での時刻iにおける制御偏
    差 σ_k(i):k回目の試行での時刻iにおける修正量 g_1,g_2:適当な正の定数 h_0〜h_N:制御対象のステップ応答 のサンプル値の差分値 あるいはインパルス応答 のサンプル値 ただし、目標値が連続的であり、その1周 期分のサンプリング数がSである場合には e_k_−_1(j)=e_k(j−S)j>Sである
    。 とすることを特徴とする学習制御方式。
  5.  5.学習制御器の出力u_k(i)を積算器に通した
    ものを制御入力として制御対象に加えることを特徴とす
    る請求項1又は4記載の学習制御方式。
  6.  6.充分な繰り返しを経て制御偏差が希望する値以下
    に収束した後は、メモリに記憶されている1試行分の修
    正量σを用いて、制御入力u_k(i)を u_k(i)=g_1・e_k(i)+g_2σ(i)
    として与えることを特徴とする請求項1又は4記載の学
    習制御方式。
JP63295341A 1988-11-22 1988-11-22 学習制御方法 Expired - Fee Related JP2541166B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63295341A JP2541166B2 (ja) 1988-11-22 1988-11-22 学習制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63295341A JP2541166B2 (ja) 1988-11-22 1988-11-22 学習制御方法

Publications (2)

Publication Number Publication Date
JPH02140803A true JPH02140803A (ja) 1990-05-30
JP2541166B2 JP2541166B2 (ja) 1996-10-09

Family

ID=17819361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63295341A Expired - Fee Related JP2541166B2 (ja) 1988-11-22 1988-11-22 学習制御方法

Country Status (1)

Country Link
JP (1) JP2541166B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62118406A (ja) * 1985-11-19 1987-05-29 Yaskawa Electric Mfg Co Ltd 未来目標値と過去の操作量及び試行時の偏差の情報を用いる制御方式
JPS62245401A (ja) * 1986-04-18 1987-10-26 Mitsubishi Electric Corp 学習制御方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62118406A (ja) * 1985-11-19 1987-05-29 Yaskawa Electric Mfg Co Ltd 未来目標値と過去の操作量及び試行時の偏差の情報を用いる制御方式
JPS62245401A (ja) * 1986-04-18 1987-10-26 Mitsubishi Electric Corp 学習制御方式

Also Published As

Publication number Publication date
JP2541166B2 (ja) 1996-10-09

Similar Documents

Publication Publication Date Title
Nijmeijer et al. On Lyapunov control of the Duffing equation
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
Liu et al. Predefined‐time backstepping control for a nonlinear strict‐feedback system
JPH10133703A (ja) 適応的ロバスト制御装置
JP2005070940A (ja) Pidパラメータ調整装置
US5251124A (en) Fuzzy controller apparatus and method for steady state control
Yu et al. Controller-dynamic-linearization-based data-driven ILC for nonlinear discrete-time systems with RBFNN
Brdyś et al. Convergence and optimality of modified two-step algorithm for integrated system optimization and parameter estimation
CN114545767A (zh) 一种基于pid控制器的悬浮控制性能实时优化方法、装置
JPH11223132A (ja) ガスタービン制御方法
JPH02140803A (ja) 学習制御方法
CN115180461B (zh) 新能源汽车压缩机电机生产装备的张力数据驱动控制方法
Saikumar et al. A study of experience mapping based prediction controller for position control of DC motors with inertial and friction load changes
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
Aly et al. Multi-model control of MIMO systems: location and control algorithms
Todorovic et al. State of the art in nonlinear dynamical system identification using artificial neural networks
JPH0421101A (ja) 学習コントローラの飽和処理方式
JP3109605B2 (ja) 学習制御方法
Lin et al. Retracted: SCRIM drive system using adaptive backstepping control and mended recurrent Romanovski polynomials neural network with reformed particle swarm optimization
JP3870767B2 (ja) 予測制御方法
JPH0830979B2 (ja) 周期的目標値に最適に追従する制御方法
JP2756170B2 (ja) ニューラルネットワーク学習回路
Antunes et al. Delay Compensator: an approach to reduce the variable sampling to actuation delay effect in distributed real-time control systems
JPH01314306A (ja) 演算回路付モデル規範形適応先行制御装置
JPS62118406A (ja) 未来目標値と過去の操作量及び試行時の偏差の情報を用いる制御方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees