JPH0540504A - 学習制御方式 - Google Patents

学習制御方式

Info

Publication number
JPH0540504A
JPH0540504A JP3221107A JP22110791A JPH0540504A JP H0540504 A JPH0540504 A JP H0540504A JP 3221107 A JP3221107 A JP 3221107A JP 22110791 A JP22110791 A JP 22110791A JP H0540504 A JPH0540504 A JP H0540504A
Authority
JP
Japan
Prior art keywords
correction amount
trial
deviation
time
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3221107A
Other languages
English (en)
Other versions
JP3036654B2 (ja
Inventor
Yuji Nakamura
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP3221107A priority Critical patent/JP3036654B2/ja
Publication of JPH0540504A publication Critical patent/JPH0540504A/ja
Application granted granted Critical
Publication of JP3036654B2 publication Critical patent/JP3036654B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

(57)【要約】 【目的】同じパターンを繰り返す目標指令に制御対象の
出力を追従させるよう試行を繰り返し、k回目の試行
の、時刻iにおける制御入力uk (i) を与える学習制御
方式において、偏差の予測をより正確に行える制御方式
を提供することを目的とする。 【構成】本発明は、過去の偏差および制御対象の動特性
に関する情報をもとに未来の偏差を予測し、その予測値
の重み付き2乗和が最小となるように制御入力を補正し
ており、その際に、未来の補正量も考慮する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
【0003】
【発明が解決しようとする課題】上述の方式では、現在
時刻以降の補正量は現在時刻の値から変化しないと仮定
した上で、未来の偏差を予測し現在の補正量を決定して
いた。しかし、補正量は実際には変化するため、偏差の
予測値がずれてしまい、精度が悪化するとうという問題
があった。そこで本発明は、偏差の予測をより正確に行
える制御方式を提供することを目的とする。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本願請求項1、2、3記載の発明では、現在時刻以
降の補正量の変化も考慮した上で未来の偏差を予測して
おり、それぞれ次のような特徴を持つ。本願の請求項1
記載の発明では、同じパターンを繰り返す目標指令に制
御対象の出力を追従させるよう試行を繰り返し、k回目
の試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) Δσk (i) = wh1F T W[eL (i)-HP Δσp (i)] ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ΔσP (i):現在時刻に至るまでに入力してきた増分補正
量 eL (i):現在時刻および前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
差の予測値に掛ける重み行列によって決定される定数 HF,p : 制御対象の動特性に関する情報によって決定
される定数 W: 未来の追従偏差の予測値にかける重み行列 である。で与えることを特徴としている。本願の請求項
2記載の発明では、同じパターンを繰り返す目標指令に
制御対象の出力を追従させるよう試行を繰り返し、k回
目の試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i)
【0005】
【数4】
【0006】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k 回目の試行の時刻iにおける追従偏差 であり、さらに、 qm = (cW m H m -bW m H m-1 )/(ac-b2) m=1,2, …,M
【0007】
【数5】
【0008】であり、これらの定数は、制御対象のステ
ップ応答のサンプル値と、未来の追従偏差の予測値に掛
ける重み行列によって決定される定数である。で与える
ことを特徴としている。本願の請求項3記載の発明で
は、同じパターンを繰り返す目標指令に制御対象の出力
を追従させるよう試行を繰り返し、k回目の試行の、時
刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i)
【0009】
【数6】
【0010】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k回目の試行の時刻iにおける追従偏差 H n : 制御対象のステップ応答のサンプル値 である。で与えることを特徴としている。
【0011】
【作用】上記手段により、未来の追従偏差の予測がより
正確になり学習性能が向上する。
【0012】
【実施例】以下、本発明を図を用いて具体的に説明す
る。図1は本願請求項1記載の発明の実施例である。図
中1は指令発生器であり、現在時刻iにおける目標指令
値r(i) を発生する。2は減算器であり、目標指令rと
出力yとの偏差eを出力する。3は、定数行列wh1、H
F 、HP、Wを記憶するメモリ、4は、前回の試行の時
刻iから現在時刻iまでの偏差(ek-1 (i)〜ek (i)
)を記憶するメモリ、5は、現在時刻iに至るまでの
増分補正量Δσp (i) を記憶するメモリ、6は、前回の
試行の時刻iから現在時刻iまでの制御入力(uk-1(i)
〜uk (i) )を記憶するメモリである。 7は演算器であり、 Δσk (i) = wh1F T W[ eL (i)-HP Δσp i)] (1a) なる演算によって、時刻iにおける増分補正量Δσ
k (i) を算出する。また、8は積算器で、 σk (i) = σk (i-1) + Δσk (i) なる演算によって、時刻iにおける補正量σk (i) を算
出する。さらに、9は現在時刻iにおける補正量σ
k (i) と、前回の試行の時刻iの制御入力uk-1(i)とを
加算して、今回の制御入力uk (i) を出力する加算器で
ある。10、11はサンプリング周期Tで閉じるサンプ
ラであり、12はホールド回路である。13は入力がu
(t)で出力がy(t) の制御対象である。図2は本願請求
項2記載の発明の実施例である。図中23は、定数
1 、q2 、・・・ 、qM 、Q、g1 、g2 、・・・ 、g
N-1 を記憶するメモリ、27は、
【0013】
【数7】
【0014】なる演算によって、時刻iにおける増分補
正量Δσk (i) を算出する演算器である。図3は本願請
求項3記載の発明の実施例である。図中33は、制御対
象のステップ応答のサンプリング値 Hd, Hd+1,…,HN
記憶するメモリ、37は、
【0015】
【数8】
【0016】なる演算によって、時刻iにおける増分補
正量Δσk (i) を算出する演算器である。 (1a)〜(1c)式の導出を行う。制御対象13はステップ応
答モデルにより
【0017】
【数9】
【0018】と表すことができる。ここで、{H1 ,H2 ,
…,HN }は前もって測定された、制御対象13の単位ス
テップ応答のサンプル値である(図4)。Nは応答が十
分に整定するように、すなわち、H n ≒H N (n>N)とな
るように選ぶものとし、H0=0である。Δu(i) は、入力
u(i) の増分値で、Δu(i)=u(i)ーu(iー1) である。さ
らに、実際の出力y(i) と(2) 式のモデル出力
【0019】
【数10】
【0020】との差、すなわち、推定誤差をd(i) とす
る。
【0021】
【数11】
【0022】いまk回目の試行の、時刻iにおける制御
入力uk (i)を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1(i)からの補正量である。ここで、未来の追従
偏差の予測値ek * を以下の手順で求める。k回目の試
行の時刻iにおいて、出力yk (i) は、次式で表すこと
ができる。
【0023】
【数12】
【0024】さらにk-1 回目の試行の時刻iにおいて
は、
【0025】
【数13】
【0026】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
【0027】
【数14】
【0028】ただし、 δk (i) = yk (i) - yk-1 (i) (8)
【0029】
【数15】
【0030】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk- 1(i)からの変化分
である。さらに、時刻 i+mの出力変化分δk (i+m) は次
式で表される。
【0031】
【数16】
【0032】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δk * (i+m) (m=1,2, …,M) を求め
る際に、(2) 式のモデルによる推定誤差の変化分は不
変、すなわち、dk (i+m)-dk-1(i+m)=dk (i)-d
k-1(i)であると仮定して、(10)式から(7) 式をひくと、
【0033】
【数17】
【0034】となる。ここで、
【0035】
【数18】
【0036】であるから、(11)式より、予測値δk * (i
+m) は次式で与えられる。
【0037】
【数19】
【0038】ここでさらに、
【0039】
【数20】
【0040】と書き直せば、
【0041】
【数21】
【0042】を得る。δk (i) の定義により、時刻i+m
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) - δk (i+m) (13) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1(i+m) -δk * (i+m) (14) さらに、δk (i) も次式のように追従偏差で表すことが
できる。 δk (i) = ek-1 (i) - ek (i) (15) (12)、(14)、(15)式より、偏差の予測値ek * (i+m) は
結局次式で与えられる。
【0043】
【数22】
【0044】書き直すと、 e* (i) = eL (i) - HP ΔσP (i) - HF ΔσF (i) (17) ただし、 e* (i) = [ ek * (i+1),ek * (i+2),…, ek * (i+M) ] T L (i) = [ e1(i),e2(i),…,eM (i) ] T em(i) = ek-1(i+m)+ ek (i)-ek-1(i) m=1,2, …,M Δσp (i) = [ Δσk (i-1),Δσk (i-2),……, Δσk (i-N+1) ] T ΔσF (i) = [ Δσk (i),Δσk (i+1),…, Δσk (i+M-1) ] T
【0045】
【数23】
【0046】となる。上式より未来の追従偏差の予測値
* (i) は、現在時刻および前回の試行における追従偏
差eL (i) 、現在に至るまでに入力してきた増分補正量
Δσp (i) 、これから決定すべき現在時刻以降の増分補
正量ΔσF (i) によって予測されている。いま、Mステ
ップ未来までの追従偏差の予測値e* (i) をより小さく
するための指標として、次の評価関数J J = e* (i) T We* (i) = [eL (i)-Hp Δσp (i)-HF ΔσF (i)]T ×W[ eL (i)-Hp Δσp (i)-HF ΔσF (i)] (18)
【0047】
【数24】
【0048】を考え、この評価関数Jが最小となるよう
にΔσF (i)を決定する。ここで wm は、mステップ未
来の追従偏差の予測値ek * (i+m) にかける重み係数で
あり、図5に一例を示す。ただし,wm >0 (m=1,2,…,M)
とする。評価関数(18)を最小にするΔσF (i) は、重み
付き最小2乗推定により、次式で与えられる。 ΔσF (i)= [HF T WHF ] -1F T W[ eL (i)-HP Δσp (i)] (19) したがって、現在決定すべきΔσk (i) は、次式で与え
られる。 Δσk (i) = wh1F T W[ eL (i)-Hp Δσp (i)] (20) ただし、wh1は、行列 [HF T WHF ] -1の1行目であ
り、wh1F T Wは、ステップ応答データ{ Hn }を測
定し、重み行列Wを適当に与えることにより、学習を行
う前にあらかじめ算出できる。したがって、時刻iにお
ける増分補正量Δσk (i) は(1a)式に従って決定され
る。本願の請求項2記載の発明では、未来の補正量の増
分値Δσk (i+2) 以降は、すべて零であると仮定する
と、(17)式は、 e* (i) = eL (i) - Hp Δσp (i) - HF2 ΔσF2(i) (21) ΔσF2(i) = [ ΔσK (i),ΔσK (i+1)]T
【0049】
【数25】
【0050】となる。ここで、(18)式の評価関数Jは、 J =e* (i) T We* (i) = [eL (i)-Hp Δσp (i)-HF2ΔσF2(i)]T ×W[ eL (i)-Hp Δσp (i)-HF2ΔσF2(i)] (22) となる。この評価関数(22)を最小にするΔσF2(i) は、
同様に重み付き最小2乗推定により、次式で与えられ
る。 ΔσF2(i) = [ HF2 T WHF2 ]-1F2 T W[ eL (i)-Hp Δσp (i)] (23) ここで、
【0051】
【数26】
【0052】であるから、(23)式より現在決定すべきΔ
σk (i) は、
【0053】
【数27】
【0054】となる。さらに、 [ c,-b ]HF2 T W = [ cW1H1,cW2H2-bW2H1, …, cWM H M -bW M H M-1 ] であるから、(24)式より、
【0055】
【数28】
【0056】書き直すと、
【0057】
【数29】
【0058】ただし、
【0059】
【数30】
【0060】であり、これらの定数は、ステップ応答デ
ータ{ Hn }を測定し、重み行列Wを適当に与えること
により、学習を行う前にあらかじめ算出できる。したが
って、時刻iにおける増分補正量Δσk (i) は(1b)式に
従って決定される。本願の請求項3記載の発明では、制
御対象にむだ時間があり、H1=H2=… Hd-1=0, Hd ≠0 で
あるとして、(17)式を次のように変形する。 e* d (i) = eLd(i) - HpdΔσp (i) - HFdΔσF (i) (27) ただし、 e* d (i) = [ ek * (i+d),ek * (i+d+1),…, ek * (i+M)]T Ld(i) = [ed (i),e d+1(i), …,eM (i)]T e m (i) = ek-1 (i+m)+ek (i)-ek-1(i) m=d,d+1, …,M Δσp (i) = [ Δσk (i-1),Δσk (i-2),……, Δσk (i-N+1)]T ΔσF (i) = [ Δσk (i),Δσk (i+1),…, Δσk (i+M-1)]T
【0061】
【数31】
【0062】となる。ここで、次の評価関数J、 J = e* d (i) T We* d (i) = [eLd(i)-HpdΔσp (i)-HFdΔσF (i)]T ×W[ eLd(i)-HpdΔσp (i)-HFdΔσF (i)] (28) を最小にするΔσF (i) は、同様に重み付き最小2乗推
定により、次式で与えられる。 ΔσF (i) = [ HFd T WHFd ]-1Fd T W[ eLd(i)-HpdΔσp (i)] (29) ここで、 [ HFd T WHFd ]-1Fd T W = HFd -1-1Fd -TFd T W (30) = HFd -1 であり、さらにHFd -1の1行目は[Hd -1,0,0, …,0 ]で
あるから、(29)、(30)式より現在決定すべきΔσk (i)
は、
【0063】
【数32】
【0064】したがって、時刻iにおける増分補正量Δ
σk (i) は(1c)式に従って決定される。以上で、(1a)〜
(1c)式で与えられる増分補正量Δσk (i) が、それぞ
れ、(18)、(22)、(28)式の評価関数Jを最小にすること
が示された。
【0065】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値の重み付
き2乗和が最小となるように制御入力を補正しており、
その際に、未来の補正量も考慮しているため、最終的に
は目標値と出力が一致し、高精度な追従動作が実現され
る。
【図面の簡単な説明】
【図1】本発明の実施例を示す図
【図2】本発明の実施例を示す図
【図3】本発明の実施例を示す図
【図4】本発明の動作説明図
【図5】本発明の動作説明図
【符号の説明】
1 指令発生器 2 減算器 3、4、5、6 メモリ 7 演算器 8 積算器 9 加算器 10、11 サンプラ 12 ホールド回路 13 制御対象 23 メモリ 27 演算器 33 メモリ 37 演算器

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) Δσk (i) = wh1F T W[eL (i)-HP ΔσP (i)] (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ΔσP (i):現在時刻に至るまでに入力してきた増分補正
    量 eL (i):現在時刻および前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
    差の予測値に掛ける重み行列によって決定される定数 HF,p : 制御対象の動特性に関する情報によって決定
    される定数 W: 未来の追従偏差の予測値にかける重み行列 である) で与えることを特徴とする学習制御方式。
  2. 【請求項2】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) 【数1】 (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k 回目の試行の時刻iにおける追従偏差 であり、さらに、 qm = (cW m H m -bW m H m-1 )/(ac-b2) m=1,2, …,M 【数2】 であり、これらの定数は、制御対象のステップ応答のサ
    ンプル値と、未来の追従偏差の予測値に掛ける重み行列
    によって決定される定数である)で与えることを特徴と
    する学習制御方式。
  3. 【請求項3】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) 【数3】 (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k回目の試行の時刻iにおける追従偏差 H n : 制御対象のステップ応答のサンプル値 である)で与えることを特徴とする学習制御方式。
JP3221107A 1991-08-05 1991-08-05 学習制御方式 Expired - Fee Related JP3036654B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3221107A JP3036654B2 (ja) 1991-08-05 1991-08-05 学習制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3221107A JP3036654B2 (ja) 1991-08-05 1991-08-05 学習制御方式

Publications (2)

Publication Number Publication Date
JPH0540504A true JPH0540504A (ja) 1993-02-19
JP3036654B2 JP3036654B2 (ja) 2000-04-24

Family

ID=16761598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3221107A Expired - Fee Related JP3036654B2 (ja) 1991-08-05 1991-08-05 学習制御方式

Country Status (1)

Country Link
JP (1) JP3036654B2 (ja)

Also Published As

Publication number Publication date
JP3036654B2 (ja) 2000-04-24

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
US20230206077A1 (en) Analog learning engine and method
EP0709754B1 (en) Prediction controller
CN114988278A (zh) 一种桥式起重机的离散滑模预测控制方法
JPH0695707A (ja) モデル予測制御装置
KR100267362B1 (ko) 예견제어장치
JP3039814B2 (ja) 学習制御方式
JP3036654B2 (ja) 学習制御方式
JP3109605B2 (ja) 学習制御方法
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
JP3191836B2 (ja) 学習制御装置
JP3039573B2 (ja) 学習制御方式
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP2876702B2 (ja) 学習制御方法
JP3152251B2 (ja) 増分値演算による学習制御方法
JPH0830979B2 (ja) 周期的目標値に最適に追従する制御方法
JPH04369002A (ja) 近似ステップ応答による予見学習制御方式
JP2541166B2 (ja) 学習制御方法
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JPH10323070A (ja) モータ制御装置
JP3256950B2 (ja) 最適予見学習制御装置
JP2000035804A (ja) 学習制御方法および学習制御装置
JPH06314106A (ja) 学習制御装置
JP3281312B2 (ja) 調整方法および調整装置
JPH05119828A (ja) ステツプ応答を用いた予見制御方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees