JP3036654B2 - Learning control method - Google Patents

Learning control method

Info

Publication number
JP3036654B2
JP3036654B2 JP3221107A JP22110791A JP3036654B2 JP 3036654 B2 JP3036654 B2 JP 3036654B2 JP 3221107 A JP3221107 A JP 3221107A JP 22110791 A JP22110791 A JP 22110791A JP 3036654 B2 JP3036654 B2 JP 3036654B2
Authority
JP
Japan
Prior art keywords
equation
trial
deviation
correction amount
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3221107A
Other languages
Japanese (ja)
Other versions
JPH0540504A (en
Inventor
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP3221107A priority Critical patent/JP3036654B2/en
Publication of JPH0540504A publication Critical patent/JPH0540504A/en
Application granted granted Critical
Publication of JP3036654B2 publication Critical patent/JP3036654B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a control system for a machine tool, a robot, and the like which perform repetitive operations.

【0002】[0002]

【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
2. Description of the Related Art As a design method of a learning control system for a repetitive target value, there is a method proposed by the present applicant in Japanese Patent Application Laid-Open No. 1-237701. This method repeats the operation for the same target value, predicts the future deviation based on the past deviation and information on the dynamic characteristics of the control target, and evaluates the weighted sum of squares of the predicted value as an evaluation function. The control input is corrected so that the function is minimized. Since the target value finally matches the output, a high-precision following operation is realized.

【0003】[0003]

【発明が解決しようとする課題】上述の方式では、現在
時刻以降の補正量は現在時刻の値から変化しないと仮定
した上で、未来の偏差を予測し現在の補正量を決定して
いた。しかし、補正量は実際には変化するため、偏差の
予測値がずれてしまい、精度が悪化するとうという問題
があった。そこで本発明は、偏差の予測をより正確に行
える制御方式を提供することを目的とする。
In the above-described method, it is assumed that the correction amount after the current time does not change from the value at the current time, and a future deviation is predicted to determine the current correction amount. However, since the correction amount actually changes, there is a problem in that the predicted value of the deviation is shifted and the accuracy is deteriorated. Therefore, an object of the present invention is to provide a control method capable of more accurately predicting a deviation.

【0004】[0004]

【課題を解決するための手段】上記問題点を解決するた
め、本願記載の発明では、現在時刻以降の補正量の変化
も考慮した上で未来の偏差を予測しており、それぞれ次
のような特徴を持つ。本願の請求項1記載の発明では、
同じパターンを繰り返す目標指令に制御対象の出力を追
従させるよう試行を繰り返し、k回目の試行の、時刻i
における制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) Δσk (i) = wh1F T W[ eL (i)-HP ΔσP (i)] ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ΔσP (i):現在時刻に至るまでに入力してきた増分補正
量 eL (i):現在時刻および前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
差の予測値に掛ける重み行列によって決定される定数 HF,P : 制御対象の動特性に関する情報によって決定
される定数 W: 未来の追従偏差の予測値にかける重み行列である。
で与えることを特徴としている。本願の請求項2記載の
発明では、同じパターンを繰り返す目標指令に制御対象
の出力を追従させるよう試行を繰り返し、k回目の試行
の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i)
In order to solve the above problems, in the invention described in the present application, a future deviation is predicted in consideration of a change in the correction amount after the current time. Has features. In the invention described in claim 1 of the present application,
The trial is repeated so that the output of the control target follows the target command which repeats the same pattern, and the time i of the k-th trial is repeated.
Of the control input u k (i) in the following equation: u k (i) = u k-1 (i) + σ k (i) σ k (i) = σ k (i-1) + Δσ k (i) Δσ k (i) = w h1 H F T W [e L (i) −H P Δσ P (i)] where σ k (i) is the correction amount from the previous control input u k-1 (i) Δσ k (i): incremental value of correction amount σ k (i) Δσ P (i): incremental correction amount input up to current time e L (i): current time and follow-up deviation w in previous trial w h1: information about dynamic characteristic of the controlled object, the constant is determined by the weight matrix multiplying the predicted value of the future tracking error H F, H P: constant determined by the information on the dynamic characteristic of the controlled object W: future follow the It is a weight matrix to be applied to the predicted value of the deviation.
It is characterized by giving in. According to the invention of claim 2 of the present application, the trial is repeated so that the output of the control target follows the target command that repeats the same pattern, and the control input u k (i) at the time i of the k-th trial is expressed by the following equation u k (i) = u k-1 (i) + σ k (i) σ k (i) = σ k (i-1) + Δσ k (i)

【0005】[0005]

【数4】 (Equation 4)

【0006】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k 回目の試行の時刻iにおける追従偏差 であり、さらに、 qm = (cw m H m -bw m H m-1 )/(ac-b2) m=1,2, …,M[0006] However, σ k (i): correction amount Δσ k from the previous control input u k-1 (i) ( i): the increment value e k of the correction amount σ k (i) (i) : k th a tracking error at time i of the trial, further, q m = (cw m H m -bw m H m-1) / (ac-b 2) m = 1,2, ..., M

【0007】[0007]

【数5】 (Equation 5)

【0008】であり、これらの定数は、制御対象のステ
ップ応答のサンプル値と、未来の追従偏差の予測値に掛
ける重み行列によって決定される定数である。で与える
ことを特徴としている。他の実施例では、同じパターン
を繰り返す目標指令に制御対象の出力を追従させるよう
試行を繰り返し、k回目の試行の、時刻iにおける制御
入力uk (i) を、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i)
These constants are constants determined by a sample value of the step response of the controlled object and a weight matrix multiplied by a predicted value of the future following deviation. It is characterized by giving in. In another embodiment, the trial is repeated so that the output of the control target follows the target command that repeats the same pattern, and the control input u k (i) at the time i of the k-th trial is calculated by the following equation u k (i) = u k-1 (i) + σ k (i) σ k (i) = σ k (i-1) + Δσ k (i)

【0009】[0009]

【数6】 (Equation 6)

【0010】ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k回目の試行の時刻iにおける追従偏差 H n : 制御対象のステップ応答のサンプル値 である。で与えることを特徴としている。[0010] However, σ k (i): correction amount Δσ k from the previous control input u k-1 (i) ( i): the increment value e k of the correction amount σ k (i) (i) : k th Is the follow-up deviation H n at the time i of the trial of the trial, which is a sample value of the step response of the control object. It is characterized by giving in.

【0011】[0011]

【作用】上記手段により、未来の追従偏差の予測がより
正確になり学習性能が向上する。
According to the above means, the prediction of the future following deviation is more accurate, and the learning performance is improved.

【0012】[0012]

【実施例】以下、本発明を図を用いて具体的に説明す
る。図1は本願請求項1記載の発明の実施例である。図
中1は指令発生器であり、現在時刻iにおける目標指令
値r(i) を発生する。2は減算器であり、目標指令rと
出力yとの偏差eを出力する。3は、定数行列wh1、H
F 、HP 、Wを記憶するメモリ、4は、前回の試行の時
刻iから現在時刻iまでの偏差(ek-1 (i)〜ek (i)
)を記憶するメモリ、5は、現在時刻iに至るまでの
増分補正量ΔσP (i) を記憶するメモリ、6は、前回の
試行の時刻iから現在時刻iまでの制御入力(uk-1(i)
〜uk (i) )を記憶するメモリである。7は演算器であ
り、 Δσk (i) = wh1F T W[ eL (i)-HP ΔσP i)] (1a) なる演算によって、時刻iにおける増分補正量Δσ
k (i) を算出する。また、8は積算器で、 σk (i) = σk (i-1) + Δσk (i) なる演算によって、時刻iにおける補正量σk (i) を算
出する。さらに、9は現在時刻iにおける補正量σ
k (i) と、前回の試行の時刻iの制御入力uk-1(i)とを
加算して、今回の制御入力uk (i) を出力する加算器で
ある。10、11はサンプリング周期Tで閉じるサンプ
ラであり、12はホールド回路である。13は入力がu
(t) で出力がy(t) の制御対象である。図2は本願請求
項2記載の発明の実施例である。図中23は、定数
1 、q2、・・・ 、qM 、Q、g1 、g2 、・・・ 、g
N-1 を記憶するメモリ、27は、
BRIEF DESCRIPTION OF THE DRAWINGS FIG. FIG. 1 shows an embodiment of the invention described in claim 1 of the present application. In the figure, reference numeral 1 denotes a command generator which generates a target command value r (i) at the current time i. Reference numeral 2 denotes a subtractor, which outputs a deviation e between the target command r and the output y. 3 is a constant matrix w h1 , H
F, H P, a memory for storing W, 4 the deviation from the time i of the previous attempts to the current time i (e k-1 (i ) ~e k (i)
Memory for storing), the memory 5, to store the incremental correction amount .DELTA..sigma P up to the present time i (i), 6 is a control input from the time i of the previous attempts to the current time i (u k- 1 (i)
~u k (i)) is a memory for storing. Numeral 7 denotes an arithmetic unit, and an incremental correction amount Δσ at a time i is calculated by an operation of Δσ k (i) = w h1 H F T W [e L (i) −H P Δσ P i)]
Calculate k (i). Reference numeral 8 denotes an integrator which calculates a correction amount σ k (i) at time i by an operation of σ k (i) = σ k (i−1) + Δσ k (i). Further, 9 is the correction amount σ at the current time i.
The adder adds k (i) and the control input u k-1 (i) at the time i of the previous trial, and outputs the current control input u k (i). Reference numerals 10 and 11 denote samplers which are closed at a sampling period T, and reference numeral 12 denotes a hold circuit. 13 is input u
At (t), the output is the control target of y (t). FIG. 2 shows an embodiment of the invention described in claim 2 of the present application. 23, constants q 1 , q 2 ,..., Q M , Q, g 1 , g 2 ,.
The memory for storing N-1 , 27

【0013】[0013]

【数7】 (Equation 7)

【0014】なる演算によって、時刻iにおける増分補
正量Δσk (i) を算出する演算器である。図3は他の実
施例である。図中33は、制御対象のステップ応答のサ
ンプリング値 Hd, Hd+1,…,HN を記憶するメモリ、37
は、
This is an arithmetic unit for calculating the incremental correction amount Δσ k (i) at time i by the following calculation. FIG. 3 shows another embodiment. In the figure, reference numeral 33 denotes a memory for storing sampling values H d, H d + 1 ,..., H N of the step response of the control object;
Is

【0015】[0015]

【数8】 (Equation 8)

【0016】なる演算によって、時刻iにおける増分補
正量Δσk (i) を算出する演算器である。(1a)〜(1c)式
の導出を行う。制御対象13はステップ応答モデルによ
This is an arithmetic unit that calculates the incremental correction amount Δσ k (i) at time i by the following calculation. The equations (1a) to (1c) are derived. The control target 13 is based on the step response model

【0017】[0017]

【数9】 (Equation 9)

【0018】と表すことができる。ここで、{H1 ,H2 ,
…,HN }は前もって測定された、制御対象13の単位ス
テップ応答のサンプル値である(図4)。Nは応答が十
分に整定するように、すなわち、H n ≒H N (n>N)とな
るように選ぶものとし、H0=0である。Δu(i) は、入力
u(i) の増分値で、Δu(i)=u(i)ーu(iー1) である。さ
らに、実際の出力y(i) と(2) 式のモデル出力
## EQU1 ## Where {H 1 , H 2 ,
.., H N } are sample values of the unit step response of the control target 13 measured in advance (FIG. 4). N is chosen so that the response settles sufficiently, that is, H n ≒ H N (n> N), and H 0 = 0. Δu (i) is an increment value of the input u (i), and Δu (i) = u (i) −u (i−1). Furthermore, the actual output y (i) and the model output of equation (2)

【0019】[0019]

【数10】 (Equation 10)

【0020】との差、すなわち、推定誤差をd(i) とす
る。
, Ie, the estimation error is d (i).

【0021】[0021]

【数11】 [Equation 11]

【0022】いまk回目の試行の、時刻iにおける制御
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1(i)からの補正量である。ここで、未来の追従
偏差の予測値ek * を以下の手順で求める。k回目の試
行の時刻iにおいて、出力yk (i) は、次式で表すこと
ができる。
The control input u k (i) at the time i of the k-th trial is given by the following equation. u k (i) = u k-1 (i) + σ k (i) (4) where k represents the number of trials, and σ k (i) is the value from the previous control input u k-1 (i). This is the correction amount. Here, the predicted value e k * of the future following deviation is obtained by the following procedure. At the time i of the k-th trial, the output y k (i) can be expressed by the following equation.

【0023】[0023]

【数12】 (Equation 12)

【0024】さらにk-1 回目の試行の時刻iにおいて
は、
Further, at time i of the (k-1) th trial,

【0025】[0025]

【数13】 (Equation 13)

【0026】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
## EQU1 ## By subtracting equation (6) from equation (5), the following equation is obtained.

【0027】[0027]

【数14】 [Equation 14]

【0028】ただし、 δk (i) = yk (i) - yk-1 (i) (8)Where δ k (i) = y k (i) −y k−1 (i) (8)

【0029】[0029]

【数15】 (Equation 15)

【0030】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk-1(i)からの変化分
である。さらに、時刻 i+mの出力変化分δk (i+m) は次
式で表される。
## EQU1 ## Where δ k (i) is the output y k (i)
Is the change from the output y k-1 (i) at the same time as the previous trial. Further, the output change δ k (i + m) at time i + m is represented by the following equation.

【0031】[0031]

【数16】 (Equation 16)

【0032】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δk * (i+m) (m=1,2, …,M) を求め
る際に、(2) 式のモデルによる推定誤差の変化分は不
変、すなわち、dk (i+m)-dk-1(i+m)=dk (i)-d
k-1(i)であると仮定して、(10)式から(7) 式をひくと、
Now, at time i, when calculating the predicted value δ k * (i + m) (m = 1, 2,..., M) of the output change up to M steps ahead, the model of equation (2) is used. The change of the estimation error is invariant, that is, d k (i + m) −d k−1 (i + m) = d k (i) −d
Assuming that k-1 (i), subtracting equation (7) from equation (10) gives

【0033】[0033]

【数17】 [Equation 17]

【0034】となる。ここで、## EQU1 ## here,

【0035】[0035]

【数18】 (Equation 18)

【0036】であるから、(11)式より、予測値δk * (i
+m)は次式で与えられる。
Therefore, from equation (11), the predicted value δ k * (i
+ m) is given by the following equation.

【0037】[0037]

【数19】 [Equation 19]

【0038】ここでさらに、Here,

【0039】[0039]

【数20】 (Equation 20)

【0040】と書き直せば、If rewritten as

【0041】[0041]

【数21】 (Equation 21)

【0042】を得る。δk (i) の定義により、時刻i+m
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) - δk (i+m) (13) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1(i+m) -δk * (i+m) (14) さらに、δk (i) も次式のように追従偏差で表すことが
できる。 δk (i) = ek-1 (i) - ek (i) (15) (12)、(14)、(15)式より、偏差の予測値ek * (i+m) は
結局次式で与えられる。
Is obtained. By the definition of δ k (i), the time i + m
The following deviation e k (i + m) at is expressed by the following equation. e k (i + m) = e k-1 (i + m) - δ k (i + m) (13) Therefore, the predicted value e k * (i + m) is given by the following equation. e k * (i + m) = e k-1 (i + m) -δ k * (i + m) (14) Further, δ k (i) can be expressed by the following deviation as shown in the following equation. . δ k (i) = ek-1 (i) -ek (i) (15) From equations (12), (14) and (15), the predicted value of the deviation ek * (i + m) is eventually It is given by the following equation.

【0043】[0043]

【数22】 (Equation 22)

【0044】書き直すと、 e* (i) = eL (i) - HP ΔσP (i) - HF ΔσF (i) (17) ただし、 e* (i) = [ ek * (i+1),ek * (i+2),…, ek * (i+
M) ] TL (i) = [ e1(i),e2(i),…,eM (i) ] T em(i) = ek-1(i+m)+ ek (i)-ek-1(i) m=1,2,
…,M ek (i):k 回目の試行の時刻i における追従偏差 ΔσP (i) = [ Δσk (i-1),Δσk (i-2),……, Δσk
(i-N+1) ] T ΔσF (i) = [ Δσk (i),Δσk (i+1),…, Δσk (i+M
-1) ] T
[0044] and rewritten, e * (i) = e L (i) - H P Δσ P (i) - H F Δσ F (i) (17) However, e * (i) = [ e k * (i +1), e k * (i + 2),…, e k * (i +
M)] T e L (i) = [e 1 (i), e 2 (i), ..., e M (i)] T em (i) = e k-1 (i + m) + e k ( i) -e k-1 (i) m = 1,2,
…, Me k (i): tracking deviation Δσ P (i) at time i of k-th trial = [Δσ k (i-1), Δσ k (i-2), ……, Δσ k
(i-N + 1)] T Δσ F (i) = [Δσ k (i), Δσ k (i + 1),…, Δσ k (i + M
-1)] T

【0045】[0045]

【数23】 (Equation 23)

【0046】となる。上式より未来の追従偏差の予測値
* (i) は、現在時刻および前回の試行における追従偏
差eL (i) 、現在に至るまでに入力してきた増分補正量
ΔσP (i) 、これから決定すべき現在時刻以降の増分補
正量ΔσF (i) によって予測されている。いま、WはM
ステップ未来までの追従偏差の予測値にかける重み係数
{w1,w2,…,wM }を対角要素に持つ重み行列e* (i) を
より小さくするための指標として、次の評価関数J J = e* (i) T We* (i) = [eL (i)-HP ΔσP (i)-HF ΔσF (i)]T ×W[ eL (i)-HP ΔσP (i)-HF ΔσF (i)] (18)
Is as follows. From the above equation, the predicted value e * (i) of the future following deviation is the following deviation e L (i) at the current time and the previous trial, the incremental correction amount Δσ P (i) input up to the present, and It is predicted by the incremental correction amount Δσ F (i) after the current time to be determined. Now, W is M
The following evaluation is used as an index for reducing the weight matrix e * (i) having diagonal weighting factors {w 1 , w 2 ,..., W M } applied to the predicted value of the following deviation up to the step future. function J J = e * (i) T We * (i) = [e L (i) -H P Δσ P (i) -H F Δσ F (i)] T × W [e L (i) -H P Δσ P (i) -H F Δσ F (i)] (18)

【0047】[0047]

【数24】 (Equation 24)

【0048】を考え、この評価関数Jが最小となるよう
にΔσF (i) を決定する。ここで wmは、mステップ未
来の追従偏差の予測値ek * (i+m) にかける重み係数で
あり、図5に一例を示す。ただし,wm >0 (m=1,2,…,M)
とする。評価関数(18)を最小にするΔσF (i) は、重み
付き最小2乗推定により、次式で与えられる。 ΔσF (i)= [HF T WHF ] -1F T W[ eL (i)-HP ΔσP (i)] (19) したがって、現在決定すべきΔσk (i) は、次式で与え
られる。 Δσk (i) = wh1F T W[ eL (i)-HP ΔσP (i)] (20) ただし、wh1は、行列 [HF T WHF ] -1の1行目であ
り、wh1F T Wは、ステップ応答データ{ Hn }を測
定し、重み行列Wを適当に与えることにより、学習を行
う前にあらかじめ算出できる。したがって、時刻iにお
ける増分補正量Δσk (i) は(1a)式に従って決定され
る。本願の請求項2記載の発明では、未来の補正量の増
分値Δσk (i+2) 以降は、すべて零であると仮定する
と、(17)式は、 e* (i) = eL (i) - HP ΔσP (i) - HF2 ΔσF2(i) (21) ΔσF2(i) = [ Δσk (i),Δσk (i+1)]T
Then, Δσ F (i) is determined so that the evaluation function J is minimized. Here, w m is a weight coefficient to be applied to the predicted value ek * (i + m) of the following deviation in the m-step future, and an example is shown in FIG. Where w m > 0 (m = 1,2,…, M)
And Δσ F (i) that minimizes the evaluation function (18) is given by the following equation by weighted least square estimation. Δσ F (i) = [H F T W H F ] −1 H F T W [e L (i) −H P Δσ P (i)] (19) Therefore, Δσ k (i) to be determined at present is It is given by the following equation. Δσ k (i) = w h1 H F T W [e L (i) −H P Δσ P (i)] (20) where w h1 is the first row of the matrix [H F T WH F ] −1 The w h1 H F T W can be calculated in advance before learning by measuring the step response data {H n } and appropriately giving the weight matrix W. Therefore, the incremental correction amount Δσ k (i) at time i is determined according to the equation (1a). In the invention according to claim 2 of the present application, assuming that all values are zero after the future correction amount increment value Δσ k (i + 2), equation (17) gives e * (i) = e L ( i)-H P Δσ P (i)-H F2 Δσ F2 (i) (21) Δσ F2 (i) = [Δσ k (i), Δσ k (i + 1)] T

【0049】[0049]

【数25】 (Equation 25)

【0050】となる。ここで、(18)式の評価関数Jは、 J =e* (i) T We* (i) = [eL (i)-HP ΔσP (i)-HF2ΔσF2(i)]T ×W[ eL (i)-HP ΔσP (i)-HF2ΔσF2(i)] (22) となる。この評価関数(22)を最小にするΔσF2(i) は、
同様に重み付き最小2乗推定により、次式で与えられ
る。 ΔσF2(i) = [ HF2 T WHF2 ]-1F2 T W[ eL (i)-HP ΔσP (i)] (23) ここで、
Is as follows. Here, (18) the evaluation function J of the equation, J = e * (i) T We * (i) = [e L (i) -H P Δσ P (i) -H F2 Δσ F2 (i)] T × W [e L (i) −H P Δσ P (i) −H F2 Δσ F2 (i)] (22) Δσ F2 (i) that minimizes this evaluation function (22) is
Similarly, it is given by the following equation by weighted least square estimation. Δσ F2 (i) = [H F2 T WH F2 ] −1 H F2 T W [e L (i) −H P Δσ P (i)] (23) where

【0051】[0051]

【数26】 (Equation 26)

【0052】であるから、(23)式より現在決定すべきΔ
σk (i) は、
Therefore, Δ which should be determined at present from equation (23)
σ k (i) is

【0053】[0053]

【数27】 [Equation 27]

【0054】となる。さらに、 [ c,-b ]HF2 T W = [ cw1H1,cw2H2-bw2H1, …, cwM H
M -bw M H M-1 ]であるから、(24)式より、
Is as follows. Further, [c, -b] H F2 T W = [cw 1 H 1 , cw 2 H 2 -bw 2 H 1 ,…, cw M H
M -bw M H M-1 ], from equation (24),

【0055】[0055]

【数28】 [Equation 28]

【0056】書き直すと、When rewritten,

【0057】[0057]

【数29】 (Equation 29)

【0058】ただし、However,

【0059】[0059]

【数30】 [Equation 30]

【0060】であり、これらの定数は、ステップ応答デ
ータ{ Hn }を測定し、重み行列Wを適当に与えること
により、学習を行う前にあらかじめ算出できる。したが
って、時刻iにおける増分補正量Δσk (i) は(1b)式に
従って決定される。図3に示す他の実施例では、制御対
象にむだ時間があり、H1=H2=… Hd-1=0, Hd ≠0 である
として、(17)式を次のように変形する。 e* d (i) = eLd(i) - HPdΔσP (i) - HFdΔσF (i) (27) ただし、 e* d (i) = [ ek * (i+d),ek * (i+d+1),…, ek *
(i+M)]TLd(i) = [ed (i),e d+1(i), …,eM (i)]T e m (i) = ek-1 (i+m)+ek (i)-ek-1(i) m=d,d+
1, …,M ΔσP (i) = [ Δσk (i-1),Δσk (i-2),……, Δσk
(i-N+1)]T ΔσF (i) = [ Δσk (i),Δσk (i+1),…, Δσk (i+M
-1)]T
These constants can be calculated in advance before learning by measuring the step response data {H n } and appropriately giving the weight matrix W. Therefore, the incremental correction amount Δσ k (i) at time i is determined according to the equation (1b). In another embodiment shown in FIG. 3, assuming that the control target has a dead time and H 1 = H 2 =... H d-1 = 0, H d ≠ 0, the equation (17) is modified as follows. I do. e * d (i) = e Ld (i)-H Pd Δσ P (i)-H Fd Δσ F (i) (27) where e * d (i) = [ ek * (i + d), e k * (i + d + 1),…, e k *
(i + M)] T e Ld (i) = [e d (i), e d + 1 (i),…, e M (i)] T e m (i) = e k-1 (i + m) + e k (i) -e k-1 (i) m = d, d +
1,…, M Δσ P (i) = [Δσ k (i-1), Δσ k (i-2), ……, Δσ k
(i-N + 1)] T Δσ F (i) = [Δσ k (i), Δσ k (i + 1),…, Δσ k (i + M
-1)] T

【0061】[0061]

【数31】 (Equation 31)

【0062】となる。ここで、次の評価関数J、 J = e* d (i) T We* d (i) = [eLd(i)-HPdΔσP (i)-HFdΔσF (i)]T ×W[ eLd(i)-HPdΔσP (i)-HFdΔσF (i)] (28) を最小にするΔσF (i) は、同様に重み付き最小2乗推
定により、次式で与えられる。 ΔσF (i) = [ HFd T WHFd ]-1Fd T W[ eLd(i)-HPdΔσP (i)] (29) ここで、 [ HFd T WHFd ]-1Fd T W = HFd -1-1Fd -TFd T W (30) = HFd -1 であり、さらにHFd -1の1行目は[Hd -1,0,0, …,0 ]で
あるから、(29)、(30)式より現在決定すべきΔσk (i)
は、
Is obtained. Here, the following evaluation function J, J = e * d ( i) T We * d (i) = [e Ld (i) -H Pd Δσ P (i) -H Fd Δσ F (i)] T × W [e Ld (i) -H Pd Δσ P (i) -H Fd Δσ F (i)] Δσ F to the (28) to the minimum (i) likewise by weighted least squares estimation, the following formula Given by Δσ F (i) = [H Fd T WH Fd ] −1 H Fd T W [e Ld (i) −H Pd Δσ P (i)] (29) where [H Fd T WH Fd ] −1 H fd T W = H fd -1 W -1 H fd -T H fd T W (30) = a H fd -1, further first row of H fd -1 is [H d -1, 0,0, …, 0], and Δσ k (i) to be determined at present from Eqs. (29) and (30)
Is

【0063】[0063]

【数32】 (Equation 32)

【0064】したがって、時刻iにおける増分補正量Δ
σk (i) は(1c)式に従って決定される。以上で、(1a)〜
(1c)式で与えられる増分補正量Δσk (i) が、それぞ
れ、(18)、(22)、(28)式の評価関数Jを最小にすること
が示された。
Therefore, the incremental correction amount Δ at time i
σ k (i) is determined according to equation (1c). With the above, (1a) ~
It has been shown that the incremental correction amount Δσ k (i) given by the expression (1c) minimizes the evaluation function J in the expressions (18), (22), and (28), respectively.

【0065】[0065]

【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値の重み付
き2乗和が最小となるように制御入力を補正しており、
その際に、時刻iの増分補正量Δσk (i) のみならずそ
れ以降の未来の増分補正量Δσk (i+1),Δσk (i+2),…
も考慮しているため、最終的には目標値と出力が一致
し、高精度な追従動作が実現される。
As described above, according to the present invention, in a learning control system which repeats an operation for a target value of the same pattern, a future deviation is calculated based on information on a past deviation and a dynamic characteristic of a controlled object. Prediction, and the control input is corrected so that the weighted sum of squares of the prediction value is minimized.
At that time, not only the incremental correction amount Δσ k (i) at time i but also future incremental correction amounts Δσ k (i + 1), Δσ k (i + 2),.
Therefore, the target value finally matches the output, and a high-precision following operation is realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例を示す図FIG. 1 shows an embodiment of the present invention.

【図2】本発明の実施例を示す図FIG. 2 shows an embodiment of the present invention.

【図3】本発明の実施例を示す図FIG. 3 is a diagram showing an embodiment of the present invention.

【図4】本発明の動作説明図FIG. 4 is a diagram illustrating the operation of the present invention.

【図5】本発明の動作説明図FIG. 5 is a diagram illustrating the operation of the present invention.

【符号の説明】[Explanation of symbols]

1 指令発生器 2 減算器 3、4、5、6 メモリ 7 演算器 8 積算器 9 加算器 10、11 サンプラ 12 ホールド回路 13 制御対象 23 メモリ 27 演算器 33 メモリ 37 演算器 Reference Signs List 1 command generator 2 subtractor 3, 4, 5, 6 memory 7 calculator 8 integrator 9 adder 10, 11 sampler 12 hold circuit 13 controlled object 23 memory 27 calculator 33 memory 37 calculator

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 同じパターンを繰り返す目標指令に制御
対象の出力を追従させるよう試行を繰り返し、k回目の
試行の、時刻iにおける制御入力uk (i) をMステップ
未来までの追従偏差予測値の重みつき2乗和が最小とな
るように、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) Δσk (i) = wh1F T W[ eL (i)-HP ΔσP (i)] (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ΔσP (i):現在時刻に至るまでに入力してきた増分補正
量 eL (i):現在時刻および前回の試行における追従偏差 wh1: 制御対象の動特性に関する情報と、未来の追従偏
差の予測値に掛ける重み行列によって決定される定数 HF,P : 制御対象の動特性に関する情報によって決定
される定数 W: 未来の追従偏差の予測値にかける重み行列 eL (i) = [ e1(i),e2(i),…,eM (i) ] T em(i) = ek-1(i+m)+ ek (i)-ek-1(i) m=1,2,
…,M ek (i):k 回目の試行の時刻i における追従偏差 ΔσP (i) = [ Δσk (i-1),Δσk (i-2),……, Δσk
(i-N+1) ] Th1は、行列 [HF T WHF ] -1の1行目であり、 【数1】 ここで、{H1 ,H2 ,…,HN }は前もって測定された、制
御対象の単位ステップ応答のサンプル値である。WはM
ステップ未来までの追従偏差の予測値にかける重み係数
{w1,w2,…,wM}を対角要素に持つ重み行列である)で
与えることを特徴とする学習制御方式。
1. A trial is repeated so that an output of a control target follows a target command in which the same pattern is repeated, and a control input u k (i) at a time i of a k-th trial is predicted by a following deviation prediction value up to M steps in the future. In order to minimize the weighted sum of squares of the following equation, u k (i) = u k-1 (i) + σ k (i) σ k (i) = σ k (i-1) + Δσ k (i) Δσ k (i) = w h1 H F T W [e L (i) -H P Δσ P (i)] (where, σ k (i): previous control input u k-1 (i) Correction amount Δσ k (i): increment value of correction amount σ k (i) Δσ P (i): increment correction amount input up to the current time e L (i): current time and previous trial tracking error w h1 in: information about dynamic characteristic of the controlled object, the constant is determined by the weight matrix multiplying the predicted value of the future tracking error H F, H P: constant W, which is determined by the information on the dynamic characteristic of the controlled object : Multiply the predicted value of future tracking deviation Weight matrix e L (i) = [e 1 (i), e 2 (i), ..., e M (i)] T em (i) = e k-1 (i + m) + e k (i) -e k-1 (i) m = 1,2,
…, Me k (i): tracking deviation Δσ P (i) at time i of k-th trial = [Δσ k (i-1), Δσ k (i-2), ……, Δσ k
(i-N + 1)] T w h1 is the matrix [a first line of the H F T WH F] -1, Equation 1] Here, {H 1 , H 2 ,..., H N } are sample values of the unit step response of the control object measured in advance. W is M
A weighting coefficient {w 1 , w 2 ,..., W M } to be applied to the predicted value of the following deviation up to the step future is a weight matrix having diagonal elements).
【請求項2】 同じパターンを繰り返す目標指令に制御
対象の出力を追従させるよう試行を繰り返し、k回目の
試行の、時刻iにおける制御入力uk (i) をMステップ
未来までの追従偏差予測値の重みつき2乗和が最小とな
るように、次式 uk (i) = uk-1(i) +σk (i) σk (i) = σk (i-1) + Δσk (i) 【数2】 (ただし、 σk (i):前回の制御入力uk-1(i)からの補正量 Δσk (i):補正量σk (i) の増分値 ek (i):k 回目の試行の時刻iにおける追従偏差 であり、さらに、 qm = (cw m H m -bw m H m-1 )/(ac-b2) m=1,2, …,M 【数3】 であり、{H1 ,H2 ,…,HN }は前もって測定された、制
御対象の単位ステップ応答のサンプル値であり、wm
mステップ未来の追従偏差予測値にかける重み係数であ
る)で与えることを特徴とする学習制御方式。
2. A trial is repeated so that the output of the control target follows the target command in which the same pattern is repeated, and the control input u k (i) at the time i of the k-th trial is predicted to follow the M step forward deviation deviation value. In order to minimize the weighted sum of squares of the following equation, u k (i) = u k-1 (i) + σ k (i) σ k (i) = σ k (i-1) + Δσ k (i) [Equation 2] (However, σ k (i): correction amount .DELTA..sigma k from the preceding control input u k-1 (i) ( i): increment e k of the correction amount σ k (i) (i) : k -th trial a tracking error at time i, further, q m = (cw m H m -bw m H m-1) / (ac-b 2) m = 1,2, ..., M Equation 3] And {H 1 , H 2 ,..., H N } are sample values of the unit step response of the control target measured in advance, and w m is a weighting factor applied to the following deviation prediction value of m steps in the future. ).
JP3221107A 1991-08-05 1991-08-05 Learning control method Expired - Fee Related JP3036654B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3221107A JP3036654B2 (en) 1991-08-05 1991-08-05 Learning control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3221107A JP3036654B2 (en) 1991-08-05 1991-08-05 Learning control method

Publications (2)

Publication Number Publication Date
JPH0540504A JPH0540504A (en) 1993-02-19
JP3036654B2 true JP3036654B2 (en) 2000-04-24

Family

ID=16761598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3221107A Expired - Fee Related JP3036654B2 (en) 1991-08-05 1991-08-05 Learning control method

Country Status (1)

Country Link
JP (1) JP3036654B2 (en)

Also Published As

Publication number Publication date
JPH0540504A (en) 1993-02-19

Similar Documents

Publication Publication Date Title
KR970003823B1 (en) Control system that best follows periodical setpoint value
JP3175877B2 (en) Preview control device
KR100352024B1 (en) Motor speed control device
CN113110045B (en) Model prediction control real-time optimization parallel computing method based on computation graph
CN116048085B (en) Fault estimation and fault-tolerant iterative learning control method for mobile robot
KR100444806B1 (en) Synchronous controller
JPH0695707A (en) Model forecast controller
JP3036654B2 (en) Learning control method
JP3039814B2 (en) Learning control method
JP3109605B2 (en) Learning control method
JP2541163B2 (en) A control method that optimally follows the periodic target value.
JP3191836B2 (en) Learning control device
JP2921056B2 (en) Learning control device by correcting speed command
JP2876702B2 (en) Learning control method
JP3039573B2 (en) Learning control method
JP3152251B2 (en) Learning control method by increment value calculation
JP2594423B2 (en) Industrial robot controller
JPH04369002A (en) Predictive learning control system based upon approximate step response
JP3196907B2 (en) Learning controller for systems with dead time for output detection
JPH10323070A (en) Motor controller
JP3256950B2 (en) Optimal preview learning control device
JPH06314106A (en) Learning controller
JP2000035804A (en) Learning controlling method and learning controller
JPS62118406A (en) Control system using information of future target value, past manipulated variable and deviation at time of trial
JPH01237701A (en) Control system to optimumly follow periodical target value

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees