JP2541166B2 - Learning control method - Google Patents

Learning control method

Info

Publication number
JP2541166B2
JP2541166B2 JP63295341A JP29534188A JP2541166B2 JP 2541166 B2 JP2541166 B2 JP 2541166B2 JP 63295341 A JP63295341 A JP 63295341A JP 29534188 A JP29534188 A JP 29534188A JP 2541166 B2 JP2541166 B2 JP 2541166B2
Authority
JP
Japan
Prior art keywords
time
control
trial
controlled object
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63295341A
Other languages
Japanese (ja)
Other versions
JPH02140803A (en
Inventor
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP63295341A priority Critical patent/JP2541166B2/en
Publication of JPH02140803A publication Critical patent/JPH02140803A/en
Application granted granted Critical
Publication of JP2541166B2 publication Critical patent/JP2541166B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Control Of Position Or Direction (AREA)
  • Numerical Control (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、繰り返し動作をする工作機械,ロボット等
における学習制御方法に関する。
The present invention relates to a learning control method for a machine tool, a robot or the like that repeatedly operates.

〔従来の技術〕[Conventional technology]

繰り返し目標値に対する制御系の設計法としては、例
えば「陽子シンクロトロン電磁石電源の繰り返し運転に
おける高精度制御」井上他,電気学会論文誌C,100巻7
号において提案されている方法がある。この方法は、1
周期前の制御入力及び1周期前の制御偏差を利用してい
る点が大きな特徴となっている。これによって高精度な
追従を可能として、さらに周期的な外乱を除去するなど
の利点を有している。
As a method of designing a control system for a repetitive target value, for example, “high-accuracy control in repetitive operation of a proton synchrotron electromagnet power source” Inoue et al.
There is a method proposed in the issue. This method is 1
A major feature is that the control input before the cycle and the control deviation before the cycle are used. This has the advantage of enabling highly accurate tracking and further eliminating periodic disturbances.

この手法は、目標値が同じパターンを断続的に繰り返
す場合にも適用可能で、その際の時刻tにおける制御入
力u(t)は、 u(t)=u(t′)+e(t′) となる。ここでt′は時刻tに対応する前回の試行時の
時刻である。
This method can be applied to the case where the pattern having the same target value is repeated intermittently, and the control input u (t) at the time t at that time is u (t) = u (t ′) + e (t ′) Becomes Here, t ′ is the time at the previous trial corresponding to the time t.

また、未来の制御偏差の予測値の重み付き二乗和を最
小とする予測制御方式としては、本出願人が先に出願し
た特開昭62−118405号公報記載の方式がある。
Further, as a predictive control method for minimizing the weighted sum of squares of the predicted value of the future control deviation, there is a method described in Japanese Patent Application Laid-Open No. 62-118405 previously filed by the present applicant.

この方式は、現在サンプリング時刻iにおける制御入
力u(i)を増分制御入力を用いて、 として与えている。ここでサンプリング時刻iにおける
増分制御入力m(i)は、制御対象のインディシャル応
答のサンプリング値と過去の増分制御入力と、現在の出
力と未来の目標値とから未来の制御偏差を予測し、その
予測値の重み付き2乗和が最小となるように決定され
る。
This method uses the incremental control input for the control input u (i) at the current sampling time i, Is given as. Here, the incremental control input m (i) at the sampling time i predicts the future control deviation from the sampling value of the indicial response of the control target, the past incremental control input, the present output and the future target value, It is determined so that the weighted sum of squares of the predicted value is minimized.

この方式は、未来の目標値を利用しているため、現在
の目標値のみを用いる制御系よりも良好な応答特性が得
られ、また簡単な四則演算によって実現可能であるとい
う利点を有している。
Since this method uses future target values, it has the advantage that it has better response characteristics than a control system that uses only current target values, and that it can be implemented by simple arithmetic operations. There is.

さらに、特開昭62−118406号公報においては、同じパ
タンを繰り返す目標値に対して、前記の増分制御入力に
1試行前の制御偏差の定数倍を加えたものを、改めて増
分制御入力として与えることを特徴とする1試行前の制
御偏差を利用した予測制御方式が提案されている。
Further, in Japanese Patent Laid-Open No. 62-118406, a value obtained by adding a constant multiple of the control deviation one trial before to the target value for repeating the same pattern is given again as an incremental control input. A predictive control method using the control deviation of one trial before is proposed.

〔発明が解決しようとする課題〕[Problems to be Solved by the Invention]

しかしながら、繰り返し目標値に対する上述の設計
法、すなわち繰り返し制御方式及び特開昭62−118406号
公報のいずれにおいても、時刻iにおける制御入力u
k(i)を決定する際に、前回の偏差ek-1(i)を利用
しており、制御対象の動特性による動作の遅れ及びむだ
時間を考慮していない。
However, in any of the above-mentioned design method for the repetitive target value, that is, the repetitive control method and Japanese Patent Laid-Open No. 62-118406, the control input u
When determining k (i), the previous deviation e k-1 (i) is used, and the operation delay and dead time due to the dynamic characteristics of the controlled object are not taken into consideration.

また、前記の「陽子シンクロトロン電磁石電源の繰り
返し運転における高精度制御」に記載された方法では、
それらの伝達関数が必要である。
Further, in the method described in the above "high precision control in repetitive operation of the proton synchrotron electromagnet power supply",
Those transfer functions are needed.

そこで本発明では、制御対象の伝達関数を求めるよう
な手間を必要とせずに、従来よりも収束性及び安定性に
優れた学習制御装置を実現することを目的とする。
Therefore, it is an object of the present invention to realize a learning control device that is more excellent in convergence and stability than conventional ones without requiring the trouble of obtaining the transfer function of the controlled object.

〔課題を解決するための手段及び作用〕[Means and Actions for Solving the Problems]

この目的を達成するため、本願の第1の発明の学習制
御方法は、同じパタンを連続的あるいは断続的に繰り返
す目標値に制御対象の出力を一致させるよう制御入力を
加える制御系において、 k回目の試行でのサンプリング制御iにおける制御入
力uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+{ek-1(i+C1) +ek-1(i+C2)+…+ek-1(i+CN)}/N ここで、ek(i):k回目の試行での時刻iにおける制
御偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 C1〜CN:C1<C2<C3…<CNであるN個の適当な整数 ただし、目標値が連続的であり、その1周期分のサン
プリング数がSである場合には ek-1(j)=ek(j−S) j>Sである。
In order to achieve this object, the learning control method according to the first invention of the present application is the k-th time in a control system in which a control input is added so as to match the output of a controlled object with a target value that repeats the same pattern continuously or intermittently. The control input u k (i) in the sampling control i in the trial of u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + {E k-1 (i + C 1 ) + e k-1 (i + C 2 ) + ... + e k-1 (i + C N )} / N where e k (i): control at time i in the kth trial deviation sigma k (i): correction amount at time i at k-th trial g 1, g 2: appropriate positive constant C 1 ~C N: C 1 < C 2 <C 3 ... < a C N N However, if the target value is continuous and the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S.

とし、制御対象のステップ応答を測定して、ステップ
指令開始時刻から、ステップ応答の差分値が最大となる
時刻までのサンプリング数Δを求め、時刻i+C1とi+
CNとの中間時刻i+(CN+C1)/2がi+Δとなるように
整数C1,C2,…,CNを決定するか、制御対象のインパルス
応答を測定して、そのインパルス応答が最大値をとる時
刻Δを求め、時刻i+C1とi+CNとの中間時刻i+(CN
+C1)/2がi+Δとなるように整数C1,C2,…,CNを決定
することを特徴とする この発明においては、位置の偏差値ek(i)と修正量
σ(i)とを重み付けして加算したものを制御入力uk
(i)とする。この修正量修正量σ(i)は、前回の
試行での時刻iにおける修正量σk-1(i)に、前回の
試行での制御偏差のいくつかの未来値の平均値を加えた
ものとする。このように、前回の制御偏差を利用する際
に、制御対象の遅れ分だけ後の偏差を用い、さらにそれ
ら数ステップ分を平均化して利用することにより、むだ
時間要素を含む制御対象に対して、収束性及び安定性に
優れた学習制御を実現することができる。
Then, the step response of the controlled object is measured, and the sampling number Δ from the step command start time to the time when the difference value of the step response becomes maximum is obtained, and the time i + C 1 and i +
Intermediate time i + (C N + C 1 ) / 2 integers such that a i + Δ C 1, C 2 and C N, ..., or to determine the C N, to measure the impulse response of the controlled system, the impulse response There obtains a time Δ, which takes the maximum value, an intermediate time between the time i + C 1 and i + C N i + (C N
In the present invention, the integers C 1 , C 2 , ..., C N are determined so that + C 1 ) / 2 becomes i + Δ. In the present invention, the position deviation value e k (i) and the correction amount σ k ( i) weighted and added to control input u k
(I). This correction amount correction amount σ k (i) is the correction amount σ k-1 (i) at time i in the previous trial added with the average value of some future values of the control deviation in the previous trial. I shall. In this way, when using the previous control deviation, using the deviation after the delay of the controlled object, and averaging the several steps, and using it, for the controlled object including the dead time element. Learning control with excellent convergence and stability can be realized.

また、本願の第2の発明の学習制御方法は、同じパタ
ンを連続的あるいは断続的に繰り返す目標値に制御対象
の出力を一致させるよう制御入力を加える制御系におい
て、 k回目の試行でのサンプリング制御iにおける制御入
力uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+h0ek-1(i) +h1ek-1(i+1)+…+hNek-1(i+N) ここで、ek(i):k回目の試行での時刻iにおける制
御偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 h0〜hN:制御対象のステップ応答のサンプル値の差分
値,あるいはインパルス応答のサンプル値 ただし、目標値が連続的であり、その1周期分のサン
プリング数がSである場合には ek-1(j)=ek(j−S) j>Sである。
Further, the learning control method of the second invention of the present application, in the control system for adding the control input so that the output of the controlled object coincides with the target value that repeats the same pattern continuously or intermittently, sampling at the k-th trial The control input u k (i) in control i is u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + h 0 e k- 1 (i) + h 1 e k-1 (i + 1) + ... + h N e k-1 (i + N) where e k (i): control deviation σ k (i) at time i at the k-th trial: Correction amount at time i in the k-th trial g 1 , g 2 : Appropriate positive constants h 0 to h N : Difference value of sample values of step response of controlled object or sample value of impulse response However, target value Is continuous and the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S.

とし、制御対象のステップ応答を測定して、ステップ指
令開始時刻から、ステップ応答の差分値が最大となる時
刻までのサンプリング数Δを求め、時刻iとi+Nとの
中間時刻i+N/2がi+Δとなるように整数Nを決定す
るか、制御対象のインパルス応答を測定して、そのイン
パルス応答が最大値をとる時刻Δを求め、時刻iとi+
Nとの中間時刻i+N/2がi+Δとなるように整数Nを
決定することを特徴とする。
Then, the step response of the controlled object is measured, and the sampling number Δ from the step command start time to the time when the difference value of the step response becomes maximum is obtained, and the intermediate time i + N / 2 between the time i and i + N is i + Δ. The integer N is determined so that or, the impulse response of the controlled object is measured, and the time Δ at which the impulse response takes the maximum value is obtained.
The feature is that the integer N is determined so that the intermediate time i + N / 2 with N becomes i + Δ.

この第2の発明では、修正量σ(i)として、前回
の試行での時刻iにおける修正量σk-1(i)に、ステ
ップ応答の各サンプリング時刻における差分値と前回の
試行での制御偏差の未来値とを乗じたものを加えている
ため、制御対象の遅れ分だけ後の偏差が考慮され、学習
制御系の収束性及び安定性が向上する。
In the second invention, as the correction amount σ k (i), the correction amount σ k-1 (i) at the time i in the previous trial is added to the difference value at each sampling time of the step response and the previous trial. Since the value obtained by multiplying the future value of the control deviation is added, the deviation after the delay of the controlled object is considered, and the convergence and stability of the learning control system are improved.

〔実施例〕〔Example〕

以下、本発明を具体的に説明する。 Hereinafter, the present invention will be specifically described.

本願の第1の発明に対応する実施例を第1図に示す。
その際の制御計算のフローチャートを第2図に、さらに
制御対象のステップ応答を第3図に示す。ここでの制御
対象とは、その内部に既に従来の制御ループが組まれて
いても差し支えない。
An embodiment corresponding to the first invention of the present application is shown in FIG.
FIG. 2 shows a flow chart of control calculation in that case, and FIG. 3 shows a step response of the controlled object. The controlled object here may be a conventional control loop already built therein.

図中1は指令発生器であり、同じパタン{r(0),r
(1),‥‥,r(iend)}を繰り返し発生する。2は減
算器、3,4,5は各々ゲインがg1,g2,1/3の乗算器である。
乗算器5のゲインは、後述する(1)式においてN=3
として3つの制御偏差の平均をとるために、1/3に設定
している。6は加算器、7は修正量{σ(0),σ
(1),‥‥,σ(iend)}を記憶するためのメモリで
ある。
In the figure, 1 is a command generator, which has the same pattern {r (0), r
(1), ..., r (i end )} is repeatedly generated. Reference numeral 2 is a subtracter, and reference numerals 3 and 4 are multipliers having gains g 1 , g 2 and 1/3, respectively.
The gain of the multiplier 5 is N = 3 in the equation (1) described later.
Is set to 1/3 in order to average the three control deviations. 6 is an adder, 7 is a correction amount {σ (0), σ
(1), ..., σ (i end )} is a memory for storing.

8は積算器、9,10はサンプリング周期Tで閉じるサン
プラで、11はホールド回路である。また、12はローパス
フィルタ、13は制御対象である。
Reference numeral 8 is an integrator, 9 and 10 are samplers closed at a sampling cycle T, and 11 is a hold circuit. Further, 12 is a low-pass filter and 13 is a control target.

いま、k回目の試行でのサンプリング時刻iにおける
制御入力uk(i)を ここで、ek(i):k回目の試行での時刻iにおける制
御偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 として与えることとする。
Now, the control input u k (i) at the sampling time i in the kth trial is Here, e k (i): control deviation at time i in the k-th trial σ k (i): correction amounts at time i in the k-th trial g 1 , g 2 : given as appropriate positive constants I will.

この(1)式の第1式は、位置の偏差値ek(i)と修
正量σ(i)とを重み付けして加算したものを制御入
力uk(i)とすることを意味している。また、(1)式
の第2式は、今回の試行での時刻iにおける修正量σ
(i)を、前回の試行での時刻iにおける修正量σk-1
(i)に、前回の試行での制御偏差のいつくかの未来値
の平均値を加えたものとすることを意味している。
The first expression of the expression (1) means that the deviation value e k (i) of the position and the correction amount σ k (i) are weighted and added to be the control input u k (i). ing. Further, the second expression of the expression (1) is the correction amount σ k at the time i in the present trial.
(I) is the correction amount σ k-1 at time i in the previous trial
It means that (i) is added with the average value of some future values of the control deviation in the previous trial.

時刻iにおける入力uk(i)の影響は、制御対象の遅
れ分だけ後の偏差ek(i+C1)〜ek(i+CN)に現れて
くるため、(1)式で表される制御入力の修正を行うこ
とにより、むだ時間に対する学習制御の特性が改善され
る。
The influence of the input u k (i) at the time i appears in the deviations e k (i + C 1 ) to e k (i + C N ) after the delay of the control target, so the control expressed by the equation (1) By modifying the input, the characteristics of learning control with respect to dead time are improved.

なお、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek-1(j)=ek(j−S) j>S ……(2) である。
When the target value is continuous and the number of samplings for one period is S, e k-1 (j) = e k (j−S) j> S (2).

たとえば、S=100,N=5,Δ=3のとき、C1=1,C2
2,C3=3,C4=4,C5=5とすると、k回目の試行での時刻
98における修正量σ(98)は、 σ(98)=σk-1(98)+{ek-1(99) +ek-1(100)+ek(1)+ek(2)+ek(3)}/5 となる。つまり、偏差を利用する際に数ステップ後の値
を利用するため、試行の後半部では、前回の試行ではな
く今回の試行における偏差が必要となってくる。そこ
で、(2)式の関係式に基づいて制御偏差を表す。
For example, when S = 100, N = 5, Δ = 3, C 1 = 1 and C 2 =
2, C 3 = 3, C 4 = 4, C 5 = 5, the time at the k-th trial
The correction amount σ k (98) in 98 is σ k (98) = σ k-1 (98) + {e k-1 (99) + e k-1 (100) + e k (1) + e k (2) + E k (3)} / 5. In other words, since the value after several steps is used when using the deviation, the deviation in the present trial, not in the previous trial, becomes necessary in the latter half of the trial. Therefore, the control deviation is expressed based on the relational expression (2).

第3図のステップ応答を例にとると、制御対象のステ
ップ応答の差分の最大値は、時刻4Tにおけるh4である。
Taking the step response of FIG. 3 as an example, the maximum value of the difference between the step responses of the controlled object is h 4 at time 4T.

そこで、サンプリング時刻i+C1とi+CNとの中間時
刻がi+4となるように、さらにN=3とし、 {C1,C2,C3}={3,4,5} と選ぶと、(1)式は となる。これは第2図のフローチャートにより算出され
る。
Therefore, N = 3 is further set so that the intermediate time between the sampling times i + C 1 and i + C N is i + 4, and {C 1 , C 2 , C 3 } = {3,4,5} is selected. )ceremony Becomes This is calculated according to the flowchart of FIG.

第3図のステップ応答の差分が最大値をとる時刻で
は、同じ制御対象のインパルス応答は最大値をとると言
えるので、インパルス応答が最大値をとる時刻Δを求
め、時刻i+C1とi+CNとの中間時刻i+(CN+C1)/2
がi+Δとなるように整数C1,C2,‥‥,CNを決定するこ
とができる。
The time difference between the step response of Figure 3 takes the maximum value, because the impulse response of the same control target is said to take a maximum value, obtains a time Δ the impulse response takes the maximum value, and time i + C 1 and i + C N Intermediate time i + (C N + C 1 ) / 2
The integers C 1 , C 2 , ..., C N can be determined so that becomes i + Δ.

次に、本願の第2の発明の実施例を第4図に、制御計
算のフローチャートを第5図に示す。
Next, an embodiment of the second invention of the present application is shown in FIG. 4, and a flow chart of control calculation is shown in FIG.

図中21は指令発生器であり、同じパタン{r(0),r
(1),‥‥,r(iend)}を1試行ごとに繰り返し発生
する。22は減算器、23,24,25は各々ゲインがg1,g2,h0,h
1,…,hNの乗算器である。26は加算器、27は1試行分の
修正量{σ(0),σ(1),‥‥,σ(iend)}を記
憶するためのメモリである。
In the figure, 21 is a command generator, and the same pattern {r (0), r
(1), ..., r (i end )} is repeatedly generated for each trial. 22 is a subtracter, and 23, 24, 25 are gains g 1 , g 2 , h 0 , h.
It is a multiplier of 1 , ..., h N. Reference numeral 26 is an adder, and 27 is a memory for storing the correction amount {σ (0), σ (1), ..., σ (i end )} for one trial.

28は積算器、29,30はサンプラであり、31はホールド
回路である。32はローパスフィルタ、33は制御対象であ
る。
28 is an integrator, 29 and 30 are samplers, and 31 is a hold circuit. Reference numeral 32 is a low-pass filter, and 33 is a control target.

ここでの制御対象とは、その内部に既に従来の制御ル
ープが組まれていても差し支えない。
The controlled object here may be a conventional control loop already built therein.

いま、制御対象33のステップ応答のサンプル値の差分
が第6図に示すように{h0,h1,…,hN}であるとする
と、第5図に示したフローチャートに従えば、k回目の
試行でのサンプリング時刻iにおける制御入力uk(i)
は、 uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+h0ek-1(i) +h1ek-1(i+1)+‥‥+hNek-1(i+N) ……(4) ここで、ek(i):k回目の試行での時刻iにおける制
御偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 h0〜hN:制御対象のステップ応答のサンプル値の差分
値,あるいはインパルス応答のサンプル値 として与えられる。
Now, assuming that the difference between the sample values of the step response of the controlled object 33 is {h 0 , h 1 , ..., H N } as shown in FIG. 6, according to the flowchart shown in FIG. Control input u k (i) at sampling time i in the first trial
Is u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + h 0 e k-1 (i) + h 1 e k- 1 (i + 1) + ... + h N e k-1 (i + N) (4) where e k (i): control deviation at time i in the k-th trial σ k (i): k-th The correction amounts g 1 and g 2 at the time i in the trial: Appropriate positive constants h 0 to h N : Difference values of the sampled values of the step response of the controlled object or the sampled values of the impulse response.

この(4)式の第1式は、位置の偏差値ek(i)と修
正量σ(i)とを重み付けして加算したものを制御入
力uk(i)とすることを意味している。また、(4)式
の第2式は、今回の試行での時刻iにおける修正量σ
(i)を、前回の試行での時刻iにおける修正量σk-1
(i)と、制御対象のステップ応答のサンプル値の差分
値(第6図参照)に各サンプリング時刻における制御偏
差の未来値を乗じたものを加えたものとすることを意味
している。
The first expression of the expression (4) means that the deviation value e k (i) of the position and the correction amount σ k (i) are weighted and added to be the control input u k (i). ing. The second expression of the expression (4) is the correction amount σ k at the time i in the present trial.
(I) is the correction amount σ k-1 at time i in the previous trial
(I) and the difference between the sample values of the step response of the controlled object (see FIG. 6) are multiplied by the future value of the control deviation at each sampling time.

入力の影響は制御対象の遅れ分だけ後の偏差に現れ、
さらにその影響の度合いはステップ応答の差分値に比較
するため、(4)式で表される制御入力の修正を行うこ
とにより、むだ時間に対する学習制御の特性が改善され
る。
The influence of the input appears in the deviation after the delay of the controlled object,
Further, since the degree of the influence is compared with the difference value of the step response, the characteristic of the learning control with respect to the dead time is improved by modifying the control input represented by the equation (4).

なお、定常偏差が現れる場合には、学習制御器の出力
uk(i)を積算器に通したものを制御入力として制御対
象に加えることができる。
If steady deviation appears, the output of the learning controller
What passed u k (i) through an integrator can be added to the controlled object as a control input.

また、充分な繰り返しを経て制御偏差が希望する値以
下に収束した後は、学習が完了したことになるため、メ
モリに記憶されている1試行分の修正量σを用いて、制
御入力uk(i)を、 uk(i)=g1・ek(i)+g2σ(i) として与えることができる。このときは、修正量σ
(i)の計算は不必要となる。
Further, after the control deviation converges to a desired value or less after sufficient repetition, the learning is completed. Therefore, the control input u k is used by using the correction amount σ for one trial stored in the memory. (I) can be given as u k (i) = g 1 · e k (i) + g 2 σ (i). In this case, the correction amount σ
The calculation of (i) is unnecessary.

〔発明の効果〕〔The invention's effect〕

以上に述べたように、本発明においては、前回の制御
偏差を利用する際に、制御対象の遅れ分だけ後の偏差を
用いて、さらにそれら数ステップ分を平均化して利用す
るか、あるいは制御対象の遅れをステップ応答の差分値
という形で利用している。このように、本発明では制御
対象の遅れを考慮しているため、制御対象の伝達関数を
求めるような手間を必要とせずに、従来よりも収束性及
び安定性に優れた学習制御方式を実現することができ
る。
As described above, in the present invention, when the previous control deviation is used, the deviation after the delay of the controlled object is used, and then the several steps are averaged or used. The delay of the target is used in the form of the difference value of the step response. As described above, in the present invention, since the delay of the controlled object is taken into consideration, a learning control method which is superior in convergence and stability to the conventional one is realized without the need for the trouble of obtaining the transfer function of the controlled object. can do.

【図面の簡単な説明】[Brief description of drawings]

第1図は本願の第1の発明の実施例を示すブロック図、
第2図は第1の発明における制御計算のフローチャー
ト、第3図は制御対象のステップ応答の特性図、第4図
は本願の第2の発明の実施例を示すブロック図、第5図
は第2の発明における制御計算のフローチャート、第6
図は制御対象のステップ応答の特性図である。 1:指令発生器、2:減算器 3,4,5:乗算器、6:加算器 7:メモリ、8:積算器 9,10:サンプラ、11:ホールド回路 12:ローパスフィルタ、13:制御対象 21:指令発生器、22:減算器 23,24,25:乗算器、26:加算器 27:メモリ、28:積算器 29,30:サンプラ、31:ホールド回路 32:ローパスフィルタ、33:制御対象
FIG. 1 is a block diagram showing an embodiment of the first invention of the present application,
FIG. 2 is a flow chart of control calculation in the first invention, FIG. 3 is a characteristic diagram of step response of a controlled object, FIG. 4 is a block diagram showing an embodiment of the second invention of the present application, and FIG. Flowchart of control calculation in invention of 2nd, 6th
The figure is a characteristic diagram of the step response of the controlled object. 1: Command generator, 2: Subtractor 3,4,5: Multiplier, 6: Adder 7: Memory, 8: Accumulator 9,10: Sampler, 11: Hold circuit 12: Low pass filter, 13: Control target 21: Command generator, 22: Subtractor 23, 24, 25: Multiplier, 26: Adder 27: Memory, 28: Accumulator 29, 30: Sampler, 31: Hold circuit 32: Low pass filter, 33: Control target

Claims (5)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】同じパタンを連続的あるいは断続的に繰り
返す目標値に制御対象の出力を一致させるよう制御入力
を加える制御系において、 k回目の試行でのサンプリング制御iにおける制御入力
uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+{ek-1(i+C1) +ek-1(i+C2)+…+ek-1(i+CN)}/N ここで、ek(i):k回目の試行での時刻iにおける制御
偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 C1〜CN:C1<C2<C3…<CNであるN個の適当な整数 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek-1(j)=ek(j−S) j>Sである。 とし、制御対象のステップ応答を測定して、ステップ指
令開始時刻から、ステップ応答の差分値が最大となる時
刻までのサンプリング数Δを求め、時刻i+C1とi+CN
との中間時刻i+(CN+C1)/2がi+Δとなるように整
数C1,C2,…,CNを決定することを特徴とする学習制御方
法。
1. A control input in a sampling control i in a kth trial in a control system for adding a control input so that an output of a controlled object coincides with a target value that repeats the same pattern continuously or intermittently.
Let u k (i) be u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + {e k-1 (i + C 1 ) + E k-1 (i + C 2 ) + ... + e k-1 (i + C N )} / N where e k (i): control deviation σ k (i) at the time i in the k-th trial: the k-th trial Correction amounts g 1 , g 2 at time i in trial: Appropriate positive constants C 1 to C N : C 1 <C 2 <C 3 … <C N Appropriate integers where the target value is If it is continuous and the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S. And then, by measuring the step response of the controlled object, from step instruction start time, determine the sampling number Δ up to the time the difference value of the step response is maximized, the time i + C 1 and i + C N
Intermediate time i + (C N + C 1 ) / 2 integers such that a i + Δ C 1, C 2 , ..., a learning control method characterized by determining the C N and.
【請求項2】同じパタンを連続的あるいは断続的に繰り
返す目標値に制御対象の出力を一致させるよう制御入力
を加える制御系において、 k回目の試行でのサンプリング制御iにおける制御入力
uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+{ek-1(i+C1) +ek-1(i+C2)+…+ek-1(i+CN)}/N ここで、ek(i):k回目の試行での時刻iにおける制御
偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 C1〜CN:C1<C2<C3…<CNであるN個の適当な整数 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek-1(j)=ek(j−S) j>Sである。 とし、制御対象のインパルス応答を測定して、そのイン
パルス応答が最大値をとる時刻Δを求め、時刻i+C1
i+CNとの中間時刻i+(CN+C1)/2がi+Δとなるよ
うに整数C1,C2,…,CNを決定することを特徴とする学習
制御方法。
2. A control system for adding a control input so as to match the output of a controlled object with a target value that repeats the same pattern continuously or intermittently, in the sampling control i at the k-th trial.
Let u k (i) be u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + {e k-1 (i + C 1 ) + E k-1 (i + C 2 ) + ... + e k-1 (i + C N )} / N where e k (i): control deviation σ k (i) at the time i in the k-th trial: the k-th trial Correction amounts g 1 , g 2 at time i in trial: Appropriate positive constants C 1 to C N : C 1 <C 2 <C 3 … <C N Appropriate integers where the target value is If it is continuous and the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S. Then, the impulse response of the controlled object is measured, and the time Δ at which the impulse response takes the maximum value is obtained, so that the intermediate time i + (C N + C 1 ) / 2 between the times i + C 1 and i + C N becomes A learning control method characterized by determining integers C 1 , C 2 , ..., C N.
【請求項3】同じパタンを連続的あるいは断続的に繰り
返す目標値に制御対象の出力を一致させるよう制御入力
を加える制御系において、 k回目の試行でのサンプリング制御iにおける制御入力
uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+h0ek-1(i) +h1ek-1(i+1)+…+hNek-1(i+N) ここで、ek(i):k回目の試行での時刻iにおける制御
偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 h0〜hN:制御対象のステップ応答のサンプル値の差分
値,あるいはインパルス応答のサンプル値 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek-1(j)=ek(j−S) j>Sである。 とし、制御対象のステップ応答を測定して、ステップ指
令開始時刻から、ステップ応答の差分値が最大となる時
刻までのサンプリング数Δを求め、時刻iとi+Nとの
中間時刻i+N/2がi+Δとなるように整数Nを決定す
ることを特徴とする学習制御方法。
3. A control system for adding a control input so that the output of a controlled object coincides with a target value that repeats the same pattern continuously or intermittently, in the sampling control i in the kth trial.
Let u k (i) be u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + h 0 e k-1 (i) + h 1 e k-1 (i + 1) + ... + h N e k-1 (i + N) where e k (i): control deviation at time i at the k-th trial σ k (i): at the k-th trial Correction amount g 1 , g 2 at time i: an appropriate positive constant h 0 to h N : difference value of sample values of step response of controlled object or sample value of impulse response However, the target value is continuous. If the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S. Then, the step response of the controlled object is measured, and the sampling number Δ from the step command start time to the time when the difference value of the step response becomes maximum is obtained, and the intermediate time i + N / 2 between the time i and i + N is i + Δ. The learning control method is characterized in that the integer N is determined so that
【請求項4】同じパタンを連続的あるいは断続的に繰り
返す目標値に制御対象の出力を一致させるよう制御入力
を加える制御系において、 k回目の試行でのサンプリング制御iにおける制御入力
uk(i)を uk(i)=g1・ek(i)+g2σ(i) σ(i)=σk-1(i)+h0ek-1(i) +h1ek-1(i+1)+…+hNek-1(i+N) ここで、ek(i):k回目の試行での時刻iにおける制御
偏差 σ(i):k回目の試行での時刻iにおける修正量 g1,g2:適当な正の定数 h0〜hN:制御対象のステップ応答のサンプル値の差分
値,あるいはインパルス応答のサンプル値 ただし、目標値が連続的であり、その1周期分のサンプ
リング数がSである場合には ek-1(j)=ek(j−S) j>Sである。 とし、制御対象のインパルス応答を測定して、そのイン
パルス応答が最大値をとる時刻Δを求め、時刻iとi+
Nとの中間時刻i+N/2がi+Δとなるように整数Nを
決定することを特徴とする学習制御方法。
4. A control input in a sampling control i at a k-th trial in a control system for adding a control input so that an output of a controlled object coincides with a target value that repeats the same pattern continuously or intermittently.
Let u k (i) be u k (i) = g 1 · e k (i) + g 2 σ k (i) σ k (i) = σ k-1 (i) + h 0 e k-1 (i) + h 1 e k-1 (i + 1) + ... + h N e k-1 (i + N) where e k (i): control deviation at time i at the k-th trial σ k (i): at the k-th trial Correction amount g 1 , g 2 at time i: an appropriate positive constant h 0 to h N : difference value of sample values of step response of controlled object or sample value of impulse response However, the target value is continuous. If the number of samplings for one cycle is S, then e k−1 (j) = e k (j−S) j> S. Then, the impulse response of the controlled object is measured, the time Δ at which the impulse response takes the maximum value is obtained, and the times i and i +
A learning control method characterized by determining an integer N such that an intermediate time i + N / 2 with N becomes i + Δ.
【請求項5】学習制御器の出力uk(i)を積算器に通し
たものを制御入力として制御対象に加えることを特徴と
する請求項1ないし4のいずれかの項に記載の学習制御
方法。
5. The learning control according to claim 1, wherein the output u k (i) of the learning controller is passed through an integrator and added as a control input to the controlled object. Method.
JP63295341A 1988-11-22 1988-11-22 Learning control method Expired - Fee Related JP2541166B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63295341A JP2541166B2 (en) 1988-11-22 1988-11-22 Learning control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63295341A JP2541166B2 (en) 1988-11-22 1988-11-22 Learning control method

Publications (2)

Publication Number Publication Date
JPH02140803A JPH02140803A (en) 1990-05-30
JP2541166B2 true JP2541166B2 (en) 1996-10-09

Family

ID=17819361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63295341A Expired - Fee Related JP2541166B2 (en) 1988-11-22 1988-11-22 Learning control method

Country Status (1)

Country Link
JP (1) JP2541166B2 (en)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62118406A (en) * 1985-11-19 1987-05-29 Yaskawa Electric Mfg Co Ltd Control system using information of future target value, past manipulated variable and deviation at time of trial
JPS62245401A (en) * 1986-04-18 1987-10-26 Mitsubishi Electric Corp Learning control system

Also Published As

Publication number Publication date
JPH02140803A (en) 1990-05-30

Similar Documents

Publication Publication Date Title
KR970003823B1 (en) Control system that best follows periodical setpoint value
Amann et al. Iterative learning control using optimal feedback and feedforward actions
JP2002062906A (en) Estimation control device
JPH0534682B2 (en)
JP2541166B2 (en) Learning control method
KR100267362B1 (en) Preview control apparatus
JP2541163B2 (en) A control method that optimally follows the periodic target value.
JPH0830979B2 (en) Control method that optimally follows the periodic target value
JP2876702B2 (en) Learning control method
JPH0452902B2 (en)
JP2921056B2 (en) Learning control device by correcting speed command
JP3109605B2 (en) Learning control method
JP3152250B2 (en) Preview control method by incremental value
JP2775968B2 (en) Process control equipment
JP3039814B2 (en) Learning control method
JP3870767B2 (en) Predictive control method
Kaart et al. Synchronizing chaos in an experimental chaotic pendulum using methods from linear control theory
JP2654779B2 (en) Thermoelectric generator
JPH06348305A (en) Parameter adjusting device of pid controller
JPH0237402A (en) Parameter estimating system
JPH04369002A (en) Predictive learning control system based upon approximate step response
JPS58191004A (en) Searching circuit of extreme value
JPH07141004A (en) Optimum forreseen study controller
Melody ECE 417: Project I Adaptive Minimum Prediction Error Controller and Adaptive Model Reference Control
SU892630A1 (en) Electric drive control device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees