JP3039573B2 - 学習制御方式 - Google Patents
学習制御方式Info
- Publication number
- JP3039573B2 JP3039573B2 JP3203881A JP20388191A JP3039573B2 JP 3039573 B2 JP3039573 B2 JP 3039573B2 JP 3203881 A JP3203881 A JP 3203881A JP 20388191 A JP20388191 A JP 20388191A JP 3039573 B2 JP3039573 B2 JP 3039573B2
- Authority
- JP
- Japan
- Prior art keywords
- correction amount
- equation
- trial
- deviation
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Feedback Control In General (AREA)
Description
【0001】
【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。
作機械、ロボット等の制御方式に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
【0003】
【発明が解決しようとする課題】ところが、上述の方式
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本願は、同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、k回目の試
行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) から の補正量である。で与える学習制
御系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{ek* (i+1),ek* (i+2),…, ek
* (i+M) }と増分補正量Δσk (i) の重み付き2乗和が
最小となるように、補正量σk (i) を決定することを特
徴としている。
め、本願は、同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、k回目の試
行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) から の補正量である。で与える学習制
御系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{ek* (i+1),ek* (i+2),…, ek
* (i+M) }と増分補正量Δσk (i) の重み付き2乗和が
最小となるように、補正量σk (i) を決定することを特
徴としている。
【0005】
【作用】上記手段により、補正の度合いを調節したり、
制御入力の値やその変化の度合いに制約を与えたりする
ことが可能となる。
制御入力の値やその変化の度合いに制約を与えたりする
ことが可能となる。
【0006】
【実施例】本発明は目標指令が一定周期で連続的に繰り
返す場合にも適用可能であるが、制御入力を決定する際
に偏差の現在値を利用しないため、各試行を間欠的に行
い、各試行間に次の1試行分の制御入力をオフライン的
にまとめて算出することも可能である。ここでは、後者
の場合について本発明の具体的実施例を図1に示して説
明する。図中1は同じパターンを間欠的に発生する指令
発生器であり、1試行分の目標指令値の系列{r(j) }
(j=i0,i0+1,…,in ) を発生する。ここで、i0と in
は、試行の開始時刻と終了時刻である。2は減算器であ
り、今回の試行時の偏差の系列{ek (j) } (j=i0,i0+
1,…,in ) を出力する。3は、定数q1 、q2 、・・・ 、
qM 、f1 、f2、・・・ 、fN-1、Cを記憶するメモリ、
4は、今回試行時の補正量σk (j) (j=i0,i0+1, …,i
n ) を記憶するメモリ、5は、前回の試行時の偏差e
k-1 (j) (j=i0,i0+1, …,in ) を記憶するメモリであ
り、今回の試行の際には、減算器2の出力値すなわち偏
差のek (j) (j=i0,i0+1, …,in ) が記憶される。6は
演算器であり、本発明では、
返す場合にも適用可能であるが、制御入力を決定する際
に偏差の現在値を利用しないため、各試行を間欠的に行
い、各試行間に次の1試行分の制御入力をオフライン的
にまとめて算出することも可能である。ここでは、後者
の場合について本発明の具体的実施例を図1に示して説
明する。図中1は同じパターンを間欠的に発生する指令
発生器であり、1試行分の目標指令値の系列{r(j) }
(j=i0,i0+1,…,in ) を発生する。ここで、i0と in
は、試行の開始時刻と終了時刻である。2は減算器であ
り、今回の試行時の偏差の系列{ek (j) } (j=i0,i0+
1,…,in ) を出力する。3は、定数q1 、q2 、・・・ 、
qM 、f1 、f2、・・・ 、fN-1、Cを記憶するメモリ、
4は、今回試行時の補正量σk (j) (j=i0,i0+1, …,i
n ) を記憶するメモリ、5は、前回の試行時の偏差e
k-1 (j) (j=i0,i0+1, …,in ) を記憶するメモリであ
り、今回の試行の際には、減算器2の出力値すなわち偏
差のek (j) (j=i0,i0+1, …,in ) が記憶される。6は
演算器であり、本発明では、
【0007】
【数3】
【0008】なる演算によって、時刻iにおける補正量
σk (i) を算出し、さらに、uk (i) = uk-1 (i) + σ
k (i)により、今回の試行時の制御入力uk (j) (j=i0,i
0+1, …,in ) を求め出力する。7は、1試行分の制御
入力を記憶するメモリで、前回の試行時には前回の試行
時の入力uk-1(j) (j=i0,i0+1,…,in ) が記憶されてお
り、前回の試行が終了した後に、演算器6によって算出
される今回の試行時の入力uk (j) (j=i0,i0+1, …,in
) が記憶され、今回の試行の際に出力される。8、9
はサンプリング周期Tで閉じるサンプラであり、10は
ホールド回路である。11は入力がu(t) で出力がy
(t) の制御対象である。(1)式の導出を行う。制御対象
11はインパルス応答モデルにより、
σk (i) を算出し、さらに、uk (i) = uk-1 (i) + σ
k (i)により、今回の試行時の制御入力uk (j) (j=i0,i
0+1, …,in ) を求め出力する。7は、1試行分の制御
入力を記憶するメモリで、前回の試行時には前回の試行
時の入力uk-1(j) (j=i0,i0+1,…,in ) が記憶されてお
り、前回の試行が終了した後に、演算器6によって算出
される今回の試行時の入力uk (j) (j=i0,i0+1, …,in
) が記憶され、今回の試行の際に出力される。8、9
はサンプリング周期Tで閉じるサンプラであり、10は
ホールド回路である。11は入力がu(t) で出力がy
(t) の制御対象である。(1)式の導出を行う。制御対象
11はインパルス応答モデルにより、
【0009】
【数4】
【0010】と表すことができる。ここで、{H 1 ,H
2 , …,HN }は前もって測定された、制御対象11の単
位ステップ応答のサンプル値である(図2)。Nは応答
が十分に整定するように、すなわち、H n = H N (n>
N)となるように選ぶ(ここの=は完全なイコールではな
く、ほぼ等しいを含む)ものとし、H0= 0 である。さら
に、実際の出力y(i) と(2) 式のモデル出力
2 , …,HN }は前もって測定された、制御対象11の単
位ステップ応答のサンプル値である(図2)。Nは応答
が十分に整定するように、すなわち、H n = H N (n>
N)となるように選ぶ(ここの=は完全なイコールではな
く、ほぼ等しいを含む)ものとし、H0= 0 である。さら
に、実際の出力y(i) と(2) 式のモデル出力
【0011】
【数5】
【0012】との差、すなわち、推定誤差をd(i) とす
る。
る。
【0013】
【数6】
【0014】いまk回目の試行の、時刻iにおける制御
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ek * を以下の手順で求める。k回目の
試行の時刻iにおいて、出力yk (i) は、次式で表すこ
とができる。
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ek * を以下の手順で求める。k回目の
試行の時刻iにおいて、出力yk (i) は、次式で表すこ
とができる。
【0015】
【数7】
【0016】さらにk−1回目の試行の時刻iにおいて
は、
は、
【0017】
【数8】
【0018】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
り、次式を得る。
【0019】
【数9】
【0020】ただし、
【0021】
【数10】
【0022】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk-1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δk (i+m) は
次式で表される。
の、前回試行時の同じ時刻の出力yk-1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δk (i+m) は
次式で表される。
【0023】
【数11】
【0024】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δk * (i+m)( m=1,2,…,M) を求め
る際に、 ・(2) 式のモデルによる推定誤差は不変、すなわち、d
k (i+m) =dk-1(i+m)であり、さらに、 ・未来の補正量は現在値から変化しない、すなわち、σ
k (i+m)=σk (i) と仮定すると、予測値δk * (i+m)
は、(10)式より、
出力変化分の予測値δk * (i+m)( m=1,2,…,M) を求め
る際に、 ・(2) 式のモデルによる推定誤差は不変、すなわち、d
k (i+m) =dk-1(i+m)であり、さらに、 ・未来の補正量は現在値から変化しない、すなわち、σ
k (i+m)=σk (i) と仮定すると、予測値δk * (i+m)
は、(10)式より、
【0025】
【数12】
【0026】となる。δk (i) の定義により、時刻 i+m
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) - δk (i+m) (12) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1 (i+m) - δk * (i+m) (13) (11)、(13)式より、偏差の予測値ek * (i+m) は結局次
式で与えられる。
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) - δk (i+m) (12) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1 (i+m) - δk * (i+m) (13) (11)、(13)式より、偏差の予測値ek * (i+m) は結局次
式で与えられる。
【0027】
【数13】
【0028】上式より未来の追従偏差の予測値ek * (i
+m) は、前回の試行における追従偏差ek-1 、現在に至
るまでに入力してきた補正量σk (i-n) 、および現在決
定すべき補正量σk (i) によって予測されている。そこ
で、本願の発明では、Mステップ未来までの追従偏差の
予測値ek * (i+m) (m=1,2, …,M) をより小さくするた
めの指標として、次の評価関数J
+m) は、前回の試行における追従偏差ek-1 、現在に至
るまでに入力してきた補正量σk (i-n) 、および現在決
定すべき補正量σk (i) によって予測されている。そこ
で、本願の発明では、Mステップ未来までの追従偏差の
予測値ek * (i+m) (m=1,2, …,M) をより小さくするた
めの指標として、次の評価関数J
【0029】
【数14】
【0030】を考え、この評価関数Jが最小となるよう
にσK (i) を決定する。ここでw mは、m ステップ未来
の追従偏差の予測値ek * (i+m) にかける重み係数であ
り、近い未来の予測値ほど重視する減衰型(図3)や、
現在決定する補正量σk(i)が出力に与える影響度を考慮
したインパルス応答型(図4, wm =Hm -H m-1)などが
考えられる。ただし,wm >0 (m=1,2,…,M) とする。ま
た、c は補正量の増分値Δσk (i) にかける重み係数で
あり、c ≧0 とする。(14)、(15) 式より、∂J/∂σk
(i) = 0 は、
にσK (i) を決定する。ここでw mは、m ステップ未来
の追従偏差の予測値ek * (i+m) にかける重み係数であ
り、近い未来の予測値ほど重視する減衰型(図3)や、
現在決定する補正量σk(i)が出力に与える影響度を考慮
したインパルス応答型(図4, wm =Hm -H m-1)などが
考えられる。ただし,wm >0 (m=1,2,…,M) とする。ま
た、c は補正量の増分値Δσk (i) にかける重み係数で
あり、c ≧0 とする。(14)、(15) 式より、∂J/∂σk
(i) = 0 は、
【0031】
【数15】
【0032】となり、上式は未知数σk (i) に関する1
次方程式である。さらに、
次方程式である。さらに、
【0033】
【数16】
【0034】であるため、(15) 式の評価関数を最小に
するσk (i) は(16)式より、
するσk (i) は(16)式より、
【0035】
【数17】
【0036】を満たす。したがって、時刻iにおける補
正量σk (i) は(1)式に従って決定される。ただし
正量σk (i) は(1)式に従って決定される。ただし
【0037】
【数18】
【0038】であり、これらの定数は、ステップ応答デ
ータ{H n }を測定し、重み係数{w m }を適当に与え
ることにより、学習を行う前にあらかじめ算出できる。
以上で、(1)式で与えられる補正量σk (i) が、(15) 式
の評価関数Jを最小にすることが示された。なお、重み
係数c は、試行を重ねる過程で、学習が利きすぎる場合
は大きくしたり、収束を速くしたい箇所では小さくした
りして、変化させても良い。
ータ{H n }を測定し、重み係数{w m }を適当に与え
ることにより、学習を行う前にあらかじめ算出できる。
以上で、(1)式で与えられる補正量σk (i) が、(15) 式
の評価関数Jを最小にすることが示された。なお、重み
係数c は、試行を重ねる過程で、学習が利きすぎる場合
は大きくしたり、収束を速くしたい箇所では小さくした
りして、変化させても良い。
【0039】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力あるいはその補正量の重み付き2乗和が最小とな
るように制御入力を補正していくため、補正の度合いを
調節したり、制御入力の値やその変化の度合いに制約を
与えたりすることが可能であり、最終的には目標値と出
力が一致し、高精度な追従動作が実現される。
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力あるいはその補正量の重み付き2乗和が最小とな
るように制御入力を補正していくため、補正の度合いを
調節したり、制御入力の値やその変化の度合いに制約を
与えたりすることが可能であり、最終的には目標値と出
力が一致し、高精度な追従動作が実現される。
【図1】本発明の実施例を示す図
【図2】本発明の動作説明図
【図3】本発明の動作説明図
【図4】本発明の動作説明図
2 減算器 3は、定数q1 、q2 、・・・ 、qM 、f1 、f2 、・・・
、fN-1、Cを記憶するメモリ 4 今回試行時の補正量σk (j) (j=i0,i0+1, …,in )
を記憶するメモリ 5 前回の試行時の偏差ek-1 (j) (j=i0,i0+1, …,i
n ) を記憶するメモリ 6 演算器 7 1試行分の制御入力を記憶するメモリ 8、9 サンプリング周期Tで閉じるサンプラ 10 ホールド回路 11 制御対象
、fN-1、Cを記憶するメモリ 4 今回試行時の補正量σk (j) (j=i0,i0+1, …,in )
を記憶するメモリ 5 前回の試行時の偏差ek-1 (j) (j=i0,i0+1, …,i
n ) を記憶するメモリ 6 演算器 7 1試行分の制御入力を記憶するメモリ 8、9 サンプリング周期Tで閉じるサンプラ 10 ホールド回路 11 制御対象
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G05B 21/00 - 21/02 G05B 11/00 - 13/04
Claims (3)
- 【請求項1】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、k回目の試
行の、時刻iにおける制御入力uk (i) を次式 uk (i) = uk-1 (i) +σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。で与える学習制御
系において、 Mステップ未来までの追従偏差eを予測し、それらの予
測値{ek * (i+1),ek* (i+2),…, ek * (i+M) }と
補正量の増分値Δσk (i) の重み付き2乗和 【数1】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
ek * (i+m) にかける重み係数であり、cは増分補正量
Δσk (i)=σk (i)-σk (i-1) にかける重み係数であ
る)が最小となるように、補正量σk (i) を決定するこ
とを特徴とする学習制御方式。 - 【請求項2】 k回目の試行の、時刻iにおける補正量
σk (i) を、 【数2】 (ただし、qm 、fn 、Cは、制御対象のステップ応答
のサンプル値と、予測される未来の偏差および補正量の
増分値に掛ける重みによって決定される定数である)と
することを特徴とする請求項1記載の学習制御方式。 - 【請求項3】 試行を重ねる過程で、重み係数c の値を
変化させることを特徴とする請求項1記載の学習制御方
式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3203881A JP3039573B2 (ja) | 1991-07-17 | 1991-07-17 | 学習制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3203881A JP3039573B2 (ja) | 1991-07-17 | 1991-07-17 | 学習制御方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0527805A JPH0527805A (ja) | 1993-02-05 |
JP3039573B2 true JP3039573B2 (ja) | 2000-05-08 |
Family
ID=16481269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3203881A Expired - Fee Related JP3039573B2 (ja) | 1991-07-17 | 1991-07-17 | 学習制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3039573B2 (ja) |
-
1991
- 1991-07-17 JP JP3203881A patent/JP3039573B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH0527805A (ja) | 1993-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR970003823B1 (ko) | 주기적 목표치에 최적하게 추종하는 제어방식 | |
JP3516232B2 (ja) | 最適かつ自動的に外乱を排除するフィードバック制御を実現するための方法及び装置 | |
JPH10133703A (ja) | 適応的ロバスト制御装置 | |
EP0709754B1 (en) | Prediction controller | |
KR100267362B1 (ko) | 예견제어장치 | |
JPH0695707A (ja) | モデル予測制御装置 | |
JP3039573B2 (ja) | 学習制御方式 | |
JP3214876B2 (ja) | ニューラルネットワークの構成方法およびニューラルネットワーク構築支援システム | |
JP3109605B2 (ja) | 学習制御方法 | |
JP2921056B2 (ja) | 速度指令の補正による学習制御装置 | |
JP3039814B2 (ja) | 学習制御方式 | |
JP3152251B2 (ja) | 増分値演算による学習制御方法 | |
JP2541163B2 (ja) | 周期的目標値に最適に追従する制御方式 | |
JP3191836B2 (ja) | 学習制御装置 | |
JP3036654B2 (ja) | 学習制御方式 | |
JPH04369002A (ja) | 近似ステップ応答による予見学習制御方式 | |
JP3196907B2 (ja) | 出力検出にむだ時間を持つ系の学習制御装置 | |
JP2876702B2 (ja) | 学習制御方法 | |
JP3152250B2 (ja) | 増分値による予見制御方法 | |
JP2958978B2 (ja) | 学習制御方法 | |
JP3256950B2 (ja) | 最適予見学習制御装置 | |
JPH0830979B2 (ja) | 周期的目標値に最適に追従する制御方法 | |
JPH05143109A (ja) | 速度指令の補正による学習制御方式 | |
JPH06314106A (ja) | 学習制御装置 | |
JPH0527829A (ja) | 予見制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090303 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090303 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100303 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |