JP3039573B2

JP3039573B2 - 学習制御方式

Info

Publication number: JP3039573B2
Application number: JP3203881A
Authority: JP
Inventors: 裕司中村; 健司藤本
Original assignee: Yaskawa Electric Corp
Current assignee: Yaskawa Electric Corp
Priority date: 1991-07-17
Filing date: 1991-07-17
Publication date: 2000-05-08
Anticipated expiration: 2015-05-08
Also published as: JPH0527805A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。

【０００２】

【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き２乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。

【０００３】

【発明が解決しようとする課題】ところが、上述の方式
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。

【０００４】

【課題を解決するための手段】上記問題点を解決するた
め、本願は、同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕ_k(i) を、次式ｕ_k (i) = ｕ_k-1 (i) + σ_k (i) ただし、ｋは試行回数を表わし、σ_k (i) は前回の制御
入力ｕ_k-1 (i) からの補正量である。で与える学習制
御系において、Ｍステップ未来までの追従偏差ｅを予測
し、それらの予測値｛ｅ_k* (i+1),ｅ_k* (i+2),…, ｅ_k
* (i+M) ｝と増分補正量Δσ_k (i) の重み付き２乗和が
最小となるように、補正量σ_k(i) を決定することを特
徴としている。

【０００５】

【作用】上記手段により、補正の度合いを調節したり、
制御入力の値やその変化の度合いに制約を与えたりする
ことが可能となる。

【０００６】

【実施例】本発明は目標指令が一定周期で連続的に繰り
返す場合にも適用可能であるが、制御入力を決定する際
に偏差の現在値を利用しないため、各試行を間欠的に行
い、各試行間に次の１試行分の制御入力をオフライン的
にまとめて算出することも可能である。ここでは、後者
の場合について本発明の具体的実施例を図１に示して説
明する。図中１は同じパターンを間欠的に発生する指令
発生器であり、１試行分の目標指令値の系列｛ｒ(j) ｝
(j=i₀,i₀+1,…,i_n ) を発生する。ここで、i₀と i_n
は、試行の開始時刻と終了時刻である。２は減算器であ
り、今回の試行時の偏差の系列｛ｅ_k (j) ｝ (j=i₀,i₀+
1,…,i_n ) を出力する。３は、定数ｑ₁ 、ｑ₂ 、・・・、
ｑ_M 、ｆ₁ 、ｆ₂、・・・、ｆ_N-1、Cを記憶するメモリ、
４は、今回試行時の補正量σ_k (j) (j=i₀,i₀+1, …,i
_n ) を記憶するメモリ、５は、前回の試行時の偏差ｅ
_k-1 (j) (j=i₀,i₀+1, …,i_n ) を記憶するメモリであ
り、今回の試行の際には、減算器２の出力値すなわち偏
差のｅ_k (j) (j=i₀,i₀+1, …,i_n ) が記憶される。６は
演算器であり、本発明では、

【０００７】

【数３】

【０００８】なる演算によって、時刻ｉにおける補正量
σ_k (i) を算出し、さらに、ｕ_k(i) = ｕ_k-1 (i) + σ
_k (i)により、今回の試行時の制御入力ｕ_k (j) (j=i₀,i
₀+1, …,i_n ) を求め出力する。７は、１試行分の制御
入力を記憶するメモリで、前回の試行時には前回の試行
時の入力ｕ_k-1(j) (j=i₀,i₀+1,…,i_n ) が記憶されてお
り、前回の試行が終了した後に、演算器６によって算出
される今回の試行時の入力ｕ_k (j) (j=i₀,i₀+1, …,in
) が記憶され、今回の試行の際に出力される。８、９
はサンプリング周期Ｔで閉じるサンプラであり、１０は
ホールド回路である。１１は入力がｕ(t) で出力がｙ
(t) の制御対象である。(1)式の導出を行う。制御対象
１１はインパルス応答モデルにより、

【０００９】

【数４】

【００１０】と表すことができる。ここで、｛H₁ ,H
₂ , …,H_N ｝は前もって測定された、制御対象１１の単
位ステップ応答のサンプル値である（図２）。Ｎは応答
が十分に整定するように、すなわち、H _n ＝ H _N (n＞
N)となるように選ぶ(ここの＝は完全なイコールではな
く、ほぼ等しいを含む)ものとし、H₀= 0 である。さら
に、実際の出力ｙ(i) と(2) 式のモデル出力

【００１１】

【数５】

【００１２】との差、すなわち、推定誤差をｄ(i) とす
る。

【００１３】

【数６】

【００１４】いまｋ回目の試行の、時刻ｉにおける制御
入力ｕ_k (i) を、次式で与えるものとする。ｕ_k (i) = ｕ_k-1 (i) + σ_k (i) (4) ただし、ｋは試行回数を表わし、σ_k (i) は前回の制御
入力ｕ_k-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ｅ_k * を以下の手順で求める。ｋ回目の
試行の時刻ｉにおいて、出力ｙ_k (i) は、次式で表すこ
とができる。

【００１５】

【数７】

【００１６】さらにｋ−１回目の試行の時刻ｉにおいて
は、

【００１７】

【数８】

【００１８】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。

【００１９】

【数９】

【００２０】ただし、

【００２１】

【数１０】

【００２２】である。ここでδ_k (i) は、出力ｙ_k (i)
の、前回試行時の同じ時刻の出力ｙ_k-1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δ_k (i+m) は
次式で表される。

【００２３】

【数１１】

【００２４】いま、時刻ｉにおいてＭステップ先までの
出力変化分の予測値δ_k * (i+m)( m=1,2,…,M) を求め
る際に、・(2) 式のモデルによる推定誤差は不変、すなわち、ｄ
_k(i+m) ＝ｄ_k-1(i+m)であり、さらに、・未来の補正量は現在値から変化しない、すなわち、σ
_k (i+m)=σ_k (i) と仮定すると、予測値δ_k * (i+m)
は、(10)式より、

【００２５】

【数１２】

【００２６】となる。δ_k (i) の定義により、時刻 i+m
における追従偏差ｅ_k (i+m) は次式で表される。ｅ_k (i+m) = ｅ_k-1 (i+m) - δ_k (i+m) (12) したがって, その予測値ｅ_k * (i+m) は次式で与えられ
る。ｅ_k * (i+m) = ｅ_k-1 (i+m) - δ_k * (i+m) (13) (11)、(13)式より、偏差の予測値ｅ_k * (i+m) は結局次
式で与えられる。

【００２７】

【数１３】

【００２８】上式より未来の追従偏差の予測値ｅ_k * (i
+m) は、前回の試行における追従偏差ｅ_k-1 、現在に至
るまでに入力してきた補正量σ_k (i-n) 、および現在決
定すべき補正量σ_k (i) によって予測されている。そこ
で、本願の発明では、Ｍステップ未来までの追従偏差の
予測値ｅ_k * (i+m) (m=1,2, …,M) をより小さくするた
めの指標として、次の評価関数Ｊ

【００２９】

【数１４】

【００３０】を考え、この評価関数Ｊが最小となるよう
にσ_K (i) を決定する。ここでw _mは、m ステップ未来
の追従偏差の予測値ｅ_k * (i+m) にかける重み係数であ
り、近い未来の予測値ほど重視する減衰型（図３）や、
現在決定する補正量σ_k(i)が出力に与える影響度を考慮
したインパルス応答型（図４, w_m =H_m -H _m-1）などが
考えられる。ただし,w_m >0 (m=1,2,…,M) とする。ま
た、c は補正量の増分値Δσ_k (i) にかける重み係数で
あり、c ≧0 とする。(14)、(15) 式より、∂Ｊ／∂σ_k
(i) = 0 は、

【００３１】

【数１５】

【００３２】となり、上式は未知数σ_k (i) に関する１
次方程式である。さらに、

【００３３】

【数１６】

【００３４】であるため、(15) 式の評価関数を最小に
するσ_k (i) は(16)式より、

【００３５】

【数１７】

【００３６】を満たす。したがって、時刻ｉにおける補
正量σ_k (i) は(1)式に従って決定される。ただし

【００３７】

【数１８】

【００３８】であり、これらの定数は、ステップ応答デ
ータ｛H _n ｝を測定し、重み係数｛w _m ｝を適当に与え
ることにより、学習を行う前にあらかじめ算出できる。
以上で、(1)式で与えられる補正量σ_k (i) が、(15) 式
の評価関数Ｊを最小にすることが示された。なお、重み
係数c は、試行を重ねる過程で、学習が利きすぎる場合
は大きくしたり、収束を速くしたい箇所では小さくした
りして、変化させても良い。

【００３９】

【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力あるいはその補正量の重み付き２乗和が最小とな
るように制御入力を補正していくため、補正の度合いを
調節したり、制御入力の値やその変化の度合いに制約を
与えたりすることが可能であり、最終的には目標値と出
力が一致し、高精度な追従動作が実現される。

【図面の簡単な説明】

【図１】本発明の実施例を示す図

【図２】本発明の動作説明図

【図３】本発明の動作説明図

【図４】本発明の動作説明図

【符号の説明】

２減算器３は、定数ｑ₁、ｑ₂ 、・・・、ｑ_M 、ｆ₁ 、ｆ₂ 、・・・
、ｆ_N-1、Cを記憶するメモリ４今回試行時の補正量σ_k (j) (j=i₀,i₀+1, …,i_n )
を記憶するメモリ５前回の試行時の偏差ｅ_k-1 (j) (j=i₀,i₀+1, …,i
_n ) を記憶するメモリ６演算器７１試行分の制御入力を記憶するメモリ８、９サンプリング周期Ｔで閉じるサンプラ１０ホールド回路１１制御対象

フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G05B 21/00 - 21/02 G05B 11/00 - 13/04

Claims

(57)【特許請求の範囲】

【請求項１】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕk (i) を次式ｕ_k (i) = ｕ_k-1 (i) ＋σ_k (i) ただし、ｋは試行回数を表わし、σ_k (i) は前回の制御
入力ｕ_k-1 (i) からの補正量である。で与える学習制御
系において、Ｍステップ未来までの追従偏差ｅを予測し、それらの予
測値｛ｅ_k* (i+1),ｅ_k* (i+2),…, ｅ_k * (i+M) ｝と
補正量の増分値Δσ_k(i) の重み付き２乗和【数１】（ただし、 w_m は、m ステップ未来の追従偏差の予測値
ｅ_k * (i+m) にかける重み係数であり、ｃは増分補正量
Δσ_k (i)=σ_k (i)-σ_k (i-1) にかける重み係数であ
る）が最小となるように、補正量σ_k (i) を決定するこ
とを特徴とする学習制御方式。
【請求項２】ｋ回目の試行の、時刻ｉにおける補正量
σ_k (i) を、【数２】（ただし、ｑ_m 、ｆ_n 、Ｃは、制御対象のステップ応答
のサンプル値と、予測される未来の偏差および補正量の
増分値に掛ける重みによって決定される定数である）と
することを特徴とする請求項１記載の学習制御方式。
【請求項３】試行を重ねる過程で、重み係数c の値を
変化させることを特徴とする請求項１記載の学習制御方
式。