JP3191836B2 - 学習制御装置 - Google Patents

学習制御装置

Info

Publication number
JP3191836B2
JP3191836B2 JP13546993A JP13546993A JP3191836B2 JP 3191836 B2 JP3191836 B2 JP 3191836B2 JP 13546993 A JP13546993 A JP 13546993A JP 13546993 A JP13546993 A JP 13546993A JP 3191836 B2 JP3191836 B2 JP 3191836B2
Authority
JP
Japan
Prior art keywords
deviation
correction amount
increment value
increment
control input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13546993A
Other languages
English (en)
Other versions
JPH06324710A (ja
Inventor
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP13546993A priority Critical patent/JP3191836B2/ja
Publication of JPH06324710A publication Critical patent/JPH06324710A/ja
Application granted granted Critical
Publication of JP3191836B2 publication Critical patent/JP3191836B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、工作機械、ロボット等
の制御装置に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御装置と
しては、本出願人が特開平1ー237701号公報、特願平03-1
77230 、および、特願平04-289431 において提案した装
置がある。これらの装置では、同じ目標値に対する動作
を繰り返し、偏差、補正量、制御入力、および、制御対
象のステップ応答をもとに未来偏差予測値が最小となる
ように制御入力が決定されるため、最終的には目標値と
出力が一致し、高精度な追従動作が実現される。
【0003】
【発明が解決しようとする課題】しかし従来技術では、
未来偏差の予測の際に、制御対象の十分整定するまでの
ステップ応答が必要であり、制御対象の伝達関数モデル
が得られている場合、シミュレーション等によりステッ
プ応答を算出することも考えられるが、直接的でなく、
その分の手間がかかり、さらに、整定時間の増加やサン
プリング周期の短縮に伴って演算量が増加するなどの問
題があった。そこで本発明は、伝達関数モデルを直接利
用し、演算量の少ない学習制御装置を提供することを目
的とする。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本願第1の発明では、周期Lで同じパターンを繰り
返す目標指令に、伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb ) / (1 - a1z-1
- … - aNaz -Na ) である制御対象の出力を追従させるよう、現在時刻iに
おいて、目標指令r(i)(= r(i') i'=i-L )と、D(D
≧0)サンプリング前の制御対象の出力y(i-D) を入力
し、制御入力u(i) を制御対象へ出力する学習制御装置
において、1周期前の制御入力u(i')に補正量σ(i) を
加算して、u(i) 求める手段と、目標指令を記憶し、偏
差e(i-D) を求める手段と、学習制御用定数を記憶する
手段と、偏差、補正量、制御入力の時系列データを記憶
する手段と、前記時系列データと制御対象の伝達関数モ
デルにより、Mサンプリング未来までの偏差予測値e*
と偏差e(i-D) および補正量σ(i) に関する評価関数
【0005】
【数23】
【0006】ただし、Δはサンプリング周期間の増分値
を表し(Δσ(i)=σ(i)-σ(i-1))、w m 、αは偏差に掛
ける係数、cおよびcdは補正量およびその増分値に掛け
る係数である。が最小となるように、現在時刻の補正量
σ(i) を決定する手段とを備えたことを特徴とし、本願
第2の発明では、周期Lで同じパターンを繰り返す目標
指令に、伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb )/ (1 - a1z-1 - … - aNaz -Na ) である制御対象の出力を追従させるよう、現在時刻iに
おいて、目標指令増分値Δr(i) (= Δr(i') i'=i-L
)と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δy(i-D) を入力し、制御入力u(i)を制御対象へ出
力する学習制御装置において、1周期前の制御入力増分
値Δu(i')に補正量増分値Δσ(i) を加算して、Δu
(i) 求める手段と、目標指令増分値を記憶し、偏差増分
値および偏差を求める手段と、補正量増分値より補正量
を求める手段と、学習制御用定数を記憶する手段と、偏
差増分値、補正量増分値、制御入力増分値の時系列デー
タを記憶する手段と、前記偏差と補正量と時系列データ
と制御対象の伝達関数モデルにより、Mサンプリング未
来までの偏差増分値の予測値Δe* と偏差eおよび補正
量に関する評価関数
【0007】
【数24】
【0008】(ただし、σ(i)=σ(i-1)+Δσ(i)、w m
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。)が最小となるように、現
在時刻の補正量増分値Δσ(i) を決定する手段と、制御
入力増分値より制御入力を求める手段とを備えたことを
特徴とし、本願第3の発明では、周期Lで同じパターン
を繰り返す目標指令に、伝達関数モデルが、 Gp(z) = (b1z -1 +…+bNbz-Nb ) / {(1-z-1 )(1-a1z-1 -…-aNaz-Na ) } である制御対象の出力を追従させるよう、現在時刻iに
おいて、目標指令増分値Δr(i) (= Δr(i') i'=i-L
)と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δy(i-D) を入力し、制御入力u(i)を制御対象へ出
力する学習制御装置において、1周期前の制御入力u
(i')に補正量σ(i) を加算して、u(i) を求める手段
と、目標指令増分値を記憶し、偏差増分値および偏差を
求める手段と、学習制御用定数を記憶する手段と、偏差
増分値、補正量、制御入力の時系列データを記憶する手
段と、前記偏差と時系列データと制御対象の伝達関数モ
デルにより、Mサンプリング未来までの偏差増分値の予
測値Δe* と偏差eおよび補正量に関する評価関数
【0009】
【数25】
【0010】(ただし、w m 、αは偏差に掛ける係数、c
およびcd は補正量およびその増分値に掛ける係数であ
る。)が最小となるように、現在時刻の補正量σ(i)を
決定する手段とを備えたことを特徴とする。
【0011】
【作用】上記手段により、伝達関数モデルを直接利用
し、演算量の少ない学習制御装置が実現され、高精度な
追従動作が可能となる。
【0012】
【実施例】まず、本願第1の発明の具体的実施例を図1
に示して説明する。図中1は本発明の学習制御装置であ
り、現在時刻iにおいて、周期Lで同じパターンを繰り
返す目標指令の現在値r(i) (= r(i') i'=i-L )と、
D(D ≧0)サンプリング前の制御対象の出力y(i-D) を入
力し、制御入力u(i) を制御対象へ出力する。2は、目
標指令r(i),r(i-1),…, r(i-D) を記憶するメモリ、
8は、メモリ2に記憶された目標指令r(i-D) と、出力
y(i-D) との差e(i-D) を求める減算器である。3は、
定数E, qM1 ,…, qM , p0,…, pNa, g1,…, g
Nb+Dを記憶するメモリ、4は過去の偏差を記憶するメモ
リであり、減算器8の出力e(i-D) が新たに記憶され
る。5は過去の補正量を記憶するメモリ、6は1周期前
の時刻i'までの過去の制御入力を記憶するメモリであ
る。7は演算器であり、
【0013】
【数26】
【0014】なる演算によって補正量σ(i) を算出す
る。算出されたσ(i) は、加算器9に入力されるととも
にメモリ5に記憶される。加算器9は、演算器7の出力
σ(i) とメモリ6に記憶されたu(i')とを加算して制御
入力u(i) を算出する。得られた制御入力u(i) は、学
習制御装置1の出力として制御対象に出力されるととも
に、メモリ6に記憶される。ここで(1) 式の導出を行
う。時刻iにおいて、制御入力u(i) は、加算器9によ
り次式で決定される。 u(i) = u(i') + σ(i) (2) そこで、未来偏差予測値e* (i+m) (1≦M1≦m ≦M)が最
小となるように、現在時刻の補正量σ(i) を決定するこ
とを考える。いま制御対象の伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb ) / (1 - a1z-1
- … - aNaz -Na ) の離散時間系で得られているとすると、その入出力間モ
デルは次式となる。
【0015】
【数27】
【0016】上式のモデルを用いれば、 δ(i) = y(i) - y(i') (4) で定義される出力変化分δ(i) のモデルは次式となる。
【0017】
【数28】
【0018】時刻iにおいては、時刻i-D までの出力変
化分実測値δ(i-n) (n≧D) が得られているため、それ
以降の
【0019】
【数29】
【0020】を、実測値を用いて表すと、
【0021】
【数30】
【0022】より、次式となる。
【0023】
【数31】
【0024】(ただし、 an =0 (n> Na ), bn =0 (n<1
およびn> Nb ) )で与えられる。またσ(j)=σ(i) (j>
i) とすると、(9b)式の
【0025】
【数32】
【0026】は次式となる。
【0027】
【数33】
【0028】そこで時刻i-D 以降の出力変化分を
【0029】
【数34】
【0030】で予測すると、出力変化分予測値δ* (i+
m) は、
【0031】
【数35】
【0032】で表され、係数 Amn, Bmnは、次式で与え
られる。
【0033】
【数36】
【0034】この場合、(11)式の係数 Amn,Bmnは、σ
(j)=0 (j>i) とすると、
【0035】
【数37】
【0036】(ただし、 an =0 (n> Na ), bn =0 (n<1
およびn> Nb ) )で与えられ、σ(j)=σ(i) (j>i) とす
ると、(14b) 式の Bm0は次式となる。
【0037】
【数38】
【0038】以上より、出力変化分予測値δ* (i+m) (m
≧-D+1) は(11)式で与えられ、その係数 Amn, Bmnは、
(8),(9),(12)式、あるいは(13),(14) 式で求められる。
したがって、未来偏差予測値e* (i+m) を、
【0039】
【数39】
【0040】で与え、評価関数
【0041】
【数40】
【0042】(ただし、Δσ(i)=σ(i)-σ(i-1)、w m
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。)が最小となるように、補
正量σ(i) を決定すると、∂J/ ∂σ(i) = 0 より、前
記(1) 式を得る。ただし各定数、qm , pn, E, gn
は、次式で与えられる。
【0043】
【数41】
【0044】ところで、偏差e(i-D) から制御入力u
(i) までの伝達関数Gu(z)は、p0+Eを改めてp0 と置
くと、(1),(2) 式より次式となる。
【0045】
【数42】
【0046】したがって、減算器8の出力信号e(i-D)
から制御入力u(i) までの伝達関数が(18)式となるよう
制御入力を決定する手段を備えていれば、図1の実施例
以外の構成でも、同様の効果を持つ学習制御器が実現さ
れる。さらに制御系の安定性を高めるために、上式のz
-L部分をF(z)z-Lとしても良い。ここでF(z) は、ロー
パスフィルタの伝達関数である。また、出力変化分予測
値δ* (i+m) を、(11)式の代わりに(5) 式と次式
【0047】
【数43】
【0048】(ただし Amn,Bmnは、(8),(9),(9')式でD=
0 としたときの
【0049】
【数44】
【0050】の値)によって与え、未来偏差予測値をe
* (i+m)=e(i'+m)- δ* (i+m) として、(16)式の評価関
数(ただしα=0)を最小とするよう補正量を決定すれ
ば、各試行を間欠的に行い各試行間に次回1試行分の補
正量を(5) 式と次式によりまとめて算出することもでき
る。
【0051】
【数45】
【0052】(ただし、qm , pn , gn は(17)式でD=
0 としたときの値である)つぎに、本願第2の発明の具
体的実施例を図2に示して説明する。図中21は本発明
の学習制御装置であり、現在時刻iにおいて、周期Lで
同じパターンを繰り返す目標指令の増分値Δr(i) (=
Δr(i') i'=i-L )と、D(D ≧0)サンプリング前の制御
対象の出力増分値Δy(i-D) を入力し、制御入力u(i)
を制御対象へ出力する。Δは、サンプリング周期間の増
分値を表す。22は、目標指令増分値Δr(i),…, Δr
(i-D) を記憶するメモリ、28は、メモリ22に記憶さ
れたΔr(i-D) と、Δy(i-D) との差Δe(i-D) を求め
る減算器であり、30はΔe(i-D) よりe(i-D) を求め
る積算器である。23は定数v-D+1 ,…, vM , p0,
…, pNa-1 ,E, g1,…, gNb+D-1 ,Sを記憶するメモ
リ、24は過去の偏差増分値を記憶するメモリであり、
減算器28の出力Δe(i-D) が新たに記憶される。25
は過去の補正量増分値を記憶するメモリ、31は補正量
σ(i-1) を求める積算器、26は1周期前の時刻i'まで
の過去の制御入力増分値を記憶するメモリである。27
は演算器であり、
【0053】
【数46】
【0054】なる演算により補正量増分値Δσ(i) を算
出する。算出されたΔσ(i) は、加算器29と積算器3
1に入力されるとともにメモリ25に記憶される。加算
器29は、演算器27の出力Δσ(i) とメモリ26に記
憶されたΔu(i')とを加算して制御入力増分値Δu(i)
を算出する。得られたΔu(i) は、積算器32に入力さ
れるとともに、メモリ26に記憶される。積算器32に
よって求められた制御入力u(i) は、学習制御装置21
の出力として制御対象に出力される。ここで(21)式の導
出を行う。時刻iにおいて、制御入力増分値Δu(i)
は、加算器29により次式で決定される。 Δu(i) = Δu(i') + Δσ(i) (22) そこで、未来偏差予測値が最小となるように、現在時刻
の補正量増分値Δσ(i)を決定することを考える。 い
ま制御対象の伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb ) / (1 - a1z-1
- … - aNaz -Na ) の離散時間系で得られているとすると、その入出力増分
値モデルは次式となる。
【0055】
【数47】
【0056】上式のモデルを用いれば、 Δδ(i) = Δy(i) - Δy(i') (24) で定義される出力増分値変化分Δδ(i) のモデルは次式
となる。
【0057】
【数48】
【0058】時刻iにおいては、時刻i-D までの変化分
実測値Δδ(i-n) (n≧D)が得られているため、それ以降
の変化分を実測値を用いて、
【0059】
【数49】
【0060】で予測すると、変化分予測値Δδ* (i+m)
は、次式となる。
【0061】
【数50】
【0062】ここで係数 Amn, Bmnは、未来の補正量増
分値をΔσ(j)=0 (j>i) とすると、
【0063】
【数51】
【0064】(ただし、 an =0 (n> Na ), bn =0 (n<1
およびn> Nb ) )で与えられる。したがって、偏差増分
値の予測値Δe* (i+m) を、(24),(27) 式より、
【0065】
【数52】
【0066】で与え、評価関数
【0067】
【数53】
【0068】(ただし、σ(i)=σ(i-1)+Δσ(i) 、w m
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。)が最小となるように、補
正量増分値Δσ(i) を決定すると、∂J/ ∂Δσ(i)=0
より、前記(21)式を得る。ただし各定数、vm , pn,
E, gn , Sは次式で与えられる。
【0069】
【数54】
【0070】ところで、偏差Δe(i-D) から制御入力増
分値Δu(i) までの伝達関数Gu(z)は、(21),(22) 式よ
【0071】
【数55】
【0072】となるため、減算器28の出力信号Δe(i
-D) から制御入力増分値Δu(i) までの伝達関数が(33)
式となるよう制御入力増分値を決定し、積算して制御入
力を求める手段を備えていれば、図2の実施例以外の構
成でも、同様の効果を持つ学習制御器が実現される。さ
らに制御系の安定性を高めるために、上式のz -L部分を
F(z)z-Lとしても良い。ここでF(z) は、ローパスフィ
ルタの伝達関数である。また、変化分予測値Δδ* (i+
m) を、(27)式の代わりに(25)式と次式
【0073】
【数56】
【0074】(ただし Amn,Bmnは、(28),(29) 式でD=0
としたときの値)によって与え、偏差増分値の予測値を
Δe* (i+m)=Δe(i'+m)- Δδ* (i+m) として、評価関
【0075】
【数57】
【0076】(ただし、w m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。)を最小とするよう補正量増分値を決定すれば、各
試行を間欠的に行い各試行間に次回1試行分の補正量増
分値を(25),(34) 式と次式によりまとめて算出すること
もできる。
【0077】
【数58】
【0078】ただし、vm , pn , E, gn , Sは(32)
式でD=0 としたときの値である。つぎに、本願第3の発
明の具体的実施例を図3に示して説明する。図中41は
本発明の学習制御装置であり、現在時刻iにおいて、周
期Lで同じパターンを繰り返す目標指令の増分値Δr
(i) (= Δr(i') i'=i-L )と、D(D ≧0)サンプリング
前の制御対象の出力増分値Δy(i-D) を入力し、制御入
力u(i) を制御対象へ出力する。Δは、サンプリング周
期間の増分値を表す。42は、目標指令増分値Δr(i),
…, Δr(i-D) を記憶するメモリ、48は、メモリ42
に記憶されたΔr(i-D) と、Δy(i-D) との差Δe(i-
D) を求める減算器であり、50はΔe(i-D) よりe(i-
D) を求める積算器である。43は定数v-D+1 ,…, v
M , p0,…, pNa-1 ,E, g1,…, gNb+D-1を記憶する
メモリ、44は過去の偏差増分値を記憶するメモリであ
り、減算器48の出力Δe(i-D) が新たに記憶される。
45は過去の補正量を記憶するメモリ、46は1周期前
の時刻i'までの過去の制御入力を記憶するメモリであ
る。47は演算器であり、
【0079】
【数59】
【0080】なる演算により補正量σ(i) を算出する。
算出されたσ(i) は、加算器49に入力されるとともに
メモリ45に記憶される。加算器49は、演算器47の
出力σ(i) とメモリ46に記憶されたu(i')とを加算し
て制御入力u(i) を算出する。得られたu(i) は、学習
制御装置41の出力として制御対象に出力されるととも
に、メモリ46に記憶される。ここで(41)式の導出を行
う。時刻iにおいて、制御入力u(i) は、加算器49に
より次式で決定される。 u(i) = u(i') + σ(i) (42) そこで、未来偏差予測値が最小となるように、現在時刻
の補正量σ(i) を決定することを考える。いま制御対象
の伝達関数モデルが、 Gp(z) = (b1z -1 +…+bNbz -Nb ) / {(1-z-1 )(1-a1z
-1 -…-aNaz -Na ) } の離散時間系で得られているとすると、その入出力モデ
ルは次式となる。
【0081】
【数60】
【0082】上式のモデルを用いれば、 Δδ(i) = Δy(i) - Δy(i') (44) で定義される出力増分値変化分Δδ(i) のモデルは次式
となる。
【0083】
【数61】
【0084】時刻iにおいては、時刻i-D までの変化分
実測値Δδ(i-n) (n≧D)が得られているため、それ以降
の変化分を実測値を用いて、
【0085】
【数62】
【0086】で予測すると、変化分予測値Δδ* (i+m)
は、次式となる。
【0087】
【数63】
【0088】ここで係数 Amn, Bmnは、未来の補正量を
σ(j)=0 (j>i) とすると、
【0089】
【数64】
【0090】(ただし、 an =0 (n> Na ), bn =0 (n<1
およびn> Nb ) )で与えられる。またσ(j)=σ(i) (j>
i) とすると、(49b) 式の Bm0は次式となる。
【0091】
【数65】
【0092】したがって、偏差増分値の予測値Δe* (i
+m) を、(44),(47) 式より、
【0093】
【数66】
【0094】で与え、評価関数
【0095】
【数67】
【0096】(ただし、w m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。)が最小となるように、補正量σ(i) を決定する
と、∂J/ ∂σ(i)=0 より、前記(41)式を得る。ただし
各定数、vm , pn, E, gn は次式で与えられる。
【0097】
【数68】
【0098】(41)式は、補正量増分値Δσを用いて、
【0099】
【数69】
【0100】と書き直すこともできる。ただし、Gn
(52)式のgn より次式で与えられる。
【0101】
【数70】
【0102】ところで、偏差Δe(i-D) から制御入力u
(i) までの伝達関数Gu(z)は、(41),(42) 式より
【0103】
【数71】
【0104】となるため、減算器48の出力信号Δe(i
-D) から制御入力u(i) までの伝達関数が(53)式となる
よう制御入力を決定する手段を備えていれば、図3の実
施例以外の構成でも、同様の効果を持つ学習制御器が実
現される。さらに制御系の安定性を高めるために、上式
のz -L部分をF(z)z-Lとしても良い。ここでF(z) は、
ローパスフィルタの伝達関数である。また、変化分予測
値Δδ* (i+m) を、(47)式の代わりに(45)式と次式
【0105】
【数72】
【0106】(ただし Amn,Bmnは、(48),(49),(49b) 式
でD=0 としたときの値)によって与え、偏差増分値の予
測値をΔe* (i+m)=Δe(i'+m)- Δδ* (i+m) として、
評価関数
【0107】
【数73】
【0108】(ただし、w m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。)を最小とするよう補正量を決定すれば、各試行を
間欠的に行い各試行間に次回1試行分の補正量を(45),
(54) 式と次式によりまとめて算出することもできる。
【0109】
【数74】
【0110】ただし、vm , pn , E, gn は(52)式で
D=0 としたときの値である。
【0111】
【発明の効果】以上述べたように本発明によれば、伝達
関数モデルを直接利用し、演算量の少ない学習制御装置
が実現され、高精度な追従動作が可能となるという効果
がある。
【図面の簡単な説明】
【図1】本願第1の発明の具体的実施例を示す図
【図2】本願第2の発明の具体的実施例を示す図
【図3】本願第3の発明の具体的実施例を示す図
【符号の説明】
1 学習制御装置 2 目標指令を記憶するメモリ 3 定数を記憶するメモリ 4 偏差を記憶するメモリ 5 補正量を記憶するメモリ 6 制御入力を記憶するメモリ 7 演算器 8 減算器 9 加算器

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】周期Lで同じパターンを繰り返す目標指令
    に、伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb )/ (1 - a1z-1 - … - aNaz -Na ) である制御対象の出力を追従させるよう、現在時刻iに
    おいて、目標指令r(i)(= r(i') i'=i-L )と、D(D
    ≧0)サンプリング前の制御対象の出力y(i-D) を入力
    し、制御入力u(i) を制御対象へ出力する学習制御装置
    において、 1周期前の制御入力u(i')に補正量σ(i) を加算してu
    (i) を求める手段と、 目標指令を記憶して偏差e(i-D) を求める手段と、 学習制御用定数を記憶する手段と、 偏差、補正量、制御入力の時系列データを記憶する手段
    と、 前記時系列データと制御対象の伝達関数モデルにより、
    Mサンプリング未来までの偏差予測値e* と偏差e(i-
    D) および補正量σ(i) に関する評価関数 【数1】 (ただし、Δはサンプリング周期間の増分値を表す(Δ
    σ(i)=σ(i)-σ(i-1)、w m 、αは偏差に掛ける係数、cお
    よびcd は補正量およびその増分値に掛ける係数であ
    る。) が最小となるように、現在時刻の補正量σ(i) を決定す
    る手段とを備えたことを特徴とする学習制御装置。
  2. 【請求項2】 現在時刻の補正量σ(i) を 【数2】 (ここで、qm , pn, E, gn は学習制御用定数) として決定する手段を備えたことを特徴とする請求項1
    記載の学習制御装置。
  3. 【請求項3】 請求項1のu(i) を求める手段に代え
    て、偏差e(i-D) から制御入力u(i) までの伝達関数が 【数3】 (ここで、qm , pn , gn は学習制御用定数、F(z)
    はローパスフィルタの伝達関数または1) となるよう制御入力u(i) を決定する手段を備えたこと
    を特徴とする請求項1記載の学習制御装置。
  4. 【請求項4】 請求項1のu(i) を求める手段に代え
    て、1周期ごとの各試行を間欠的に行い、各試行間に前
    記伝達関数モデルにより、制御対象出力の前回試行時か
    らの変化分 【数4】 を算出し記憶する手段と、 次回試行分の制御入力を u(i) = u(i') + σ(i) 【数5】 (ここでqm , pn , gn は学習制御用定数) により1試行分まとめて決定する手段とを備えることを
    特徴とする請求項1記載の学習制御装置。
  5. 【請求項5】 周期Lで同じパターンを繰り返す目標指
    令に、伝達関数モデルが、 Gp(z) = (b1z -1 + … + bNbz -Nb )/ (1 - a1z-1 - … - aNaz -Na ) である制御対象の出力を追従させるよう、現在時刻iに
    おいて、目標指令増分値Δr(i) (= Δr(i') i'=i-L
    )と、D(D ≧0)サンプリング前の制御対象の出力増分
    値Δy(i-D) を入力し、制御入力u(i)を制御対象へ出
    力する学習制御装置において、 1周期前の制御入力増分値Δu(i')に補正量増分値Δσ
    (i) を加算してΔu(i) を求める手段と、 目標指令増分値を記憶して偏差増分値および偏差を求め
    る手段と、 補正量増分値より補正量を求める手段と、 学習制御用定数を記憶する手段と、 偏差増分値、補正量増分値、制御入力増分値の時系列デ
    ータを記憶する手段と、 前記偏差と補正量と時系列データと制御対象の伝達関数
    モデルにより、Mサンプリング未来までの偏差増分値の
    予測値Δe* と偏差eおよび補正量に関する評価関数 【数6】 (ただし、σ(i)=σ(i-1)+Δσ(i) 、w m 、αは偏差に掛
    ける係数、cおよびcdは補正量およびその増分値に掛け
    る係数である。) が最小となるように、現在時刻の補正量増分値Δσ(i)
    を決定する手段と、 制御入力増分値より制御入力を求める手段とを備えたこ
    とを特徴とする学習制御装置。
  6. 【請求項6】 現在時刻の補正量増分値Δσ(i) を 【数7】 (ここで、vm , pn ,E, gn , Sは学習制御用定
    数) として決定する手段を備えたことを特徴とする請求項5
    記載の学習制御装置。
  7. 【請求項7】 請求項5の制御入力増分値Δu(i) を決
    定する手段に代えて、偏差増分値Δe(i-D) から制御入
    力増分値Δu(i) までの伝達関数が 【数8】 (ここで、vm , pn , E, gn ,Sは学習制御用定
    数、F(z) はローパスフィルタの伝達関数または1) となるよう制御入力増分値Δu(i) を決定する手段を備
    えたことを特徴とする請求項5記載の学習制御装置。
  8. 【請求項8】 請求項5の補正量増分値Δσ(i) を決定
    する手段および制御入力増分値Δu(i) を決定する手段
    に代えて、1周期ごとの各試行を間欠的に行い、各試行
    間に 前記伝達関数モデルにより制御対象出力増分値の前回試
    行時からの変化分 【数9】 を算出し記憶する手段と、 変化分 【数10】 と前回試行時の偏差増分値より偏差 【数11】 を求め記憶する手段と、 評価関数 【数12】 (ただし、w m , αは偏差に掛ける係数,cおよびcd は補
    正量およびその増分値に掛ける係数である。) を最小とするよう次回試行分の制御入力を u(i) = u(i-1) + Δu(i) Δu(i) = Δu(i') + Δσ(i) 【数13】 (ここでvm , pn, E, gn , Sは学習制御用定数) により1試行分まとめて決定する手段とを備えることを
    特徴とする請求項5記載の学習制御装置。
  9. 【請求項9】 周期Lで同じパターンを繰り返す目標指
    令に、伝達関数モデルが、 Gp(z) = (b1z -1 +…+bNbz-Nb ) / {(1-z-1 )(1-a1z-1 -…-aNaz-Na ) } である制御対象の出力を追従させるよう、現在時刻iに
    おいて、目標指令増分値Δr(i) (= Δr(i') i'=i-L
    )と、D(D ≧0)サンプリング前の制御対象の出力増分
    値Δy(i-D) を入力し、制御入力u(i)を制御対象へ出
    力する学習制御装置において、 1周期前の制御入力u(i')に補正量σ(i) を加算してu
    (i) を求める手段と、 目標指令増分値を記憶して偏差増分値および偏差を求め
    る手段と、 学習制御用定数を記憶する手段と、 偏差増分値、補正量、制御入力の時系列データを記憶す
    る手段と、 前記偏差と時系列データと制御対象の伝達関数モデルに
    より、Mサンプリング未来までの偏差増分値の予測値Δ
    * と偏差eおよび補正量に関する評価関数 【数14】 (ただし、w m 、αは偏差に掛ける係数、cおよびcd は補
    正量およびその増分値に掛ける係数である。) が最小となるように、現在時刻の補正量σ(i) を決定す
    る手段とを備えたことを特徴とする学習制御装置。
  10. 【請求項10】 現在時刻の補正量σ(i) を 【数15】 (ここで、vm , pn, E, gn は学習制御用定数) として決定する手段を備えたことを特徴とする請求項9
    記載の学習制御装置。
  11. 【請求項11】 補正量増分値の時系列データを記憶す
    る手段と、現在時刻の補正量σ(i) を 【数16】 (ここで、vm , pn , E, Gn は学習制御用定数) として決定する手段とを備えたことを特徴とする請求項
    9記載の学習制御装置。
  12. 【請求項12】 請求項9の制御入力u(i) を決定する
    手段に代えて、偏差増分値Δe(i-D) から制御入力u
    (i) までの伝達関数が 【数17】 (ここで、vm , pn , E, gn は学習制御用定数、F
    (z)はローパスフィルタの伝達関数または1) となるよう制御入力u(i) を決定する手段を備えたこと
    を特徴とする請求項9記載の学習制御装置。
  13. 【請求項13】 請求項9の現在時刻の補正量σ(i) を
    決定する手段および制御入力u(i) を決定する手段に代
    えて、1周期ごとの各試行を間欠的に行い、各試行間に 前記伝達関数モデルにより制御対象出力増分値の前回試
    行時からの変化分 【数18】 を算出し記憶する手段と、 変化分 【数19】 と前回試行時の偏差増分値より偏差 【数20】 を求め記憶する手段と、 評価関数 【数21】 (ただし、w m 、αは偏差に掛ける係数、cおよびcd は補
    正量およびその増分値に掛ける係数である。) を最小とするよう次回試行分の制御入力を u(i) = u(i') + σ(i) 【数22】 (ここでvm , pn , E, gn は学習制御用定数) により1試行分まとめて決定する手段とを備えることを
    特徴とする請求項9記載の学習制御装置。
JP13546993A 1993-05-12 1993-05-12 学習制御装置 Expired - Fee Related JP3191836B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13546993A JP3191836B2 (ja) 1993-05-12 1993-05-12 学習制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13546993A JP3191836B2 (ja) 1993-05-12 1993-05-12 学習制御装置

Publications (2)

Publication Number Publication Date
JPH06324710A JPH06324710A (ja) 1994-11-25
JP3191836B2 true JP3191836B2 (ja) 2001-07-23

Family

ID=15152448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13546993A Expired - Fee Related JP3191836B2 (ja) 1993-05-12 1993-05-12 学習制御装置

Country Status (1)

Country Link
JP (1) JP3191836B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000122992A (ja) * 1998-08-12 2000-04-28 Sony Corp 情報処理装置および方法、並びに提供媒体
JP6536978B1 (ja) * 2018-03-15 2019-07-03 オムロン株式会社 学習装置、学習方法、及びそのプログラム

Also Published As

Publication number Publication date
JPH06324710A (ja) 1994-11-25

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
JP4697139B2 (ja) サーボ制御装置
JP2002062906A (ja) 予測制御装置
JP3175877B2 (ja) 予見制御装置
JP3191836B2 (ja) 学習制御装置
JP3158439B2 (ja) 予見制御装置
JP3109605B2 (ja) 学習制御方法
JPH06314106A (ja) 学習制御装置
JP3256950B2 (ja) 最適予見学習制御装置
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
JP3340923B2 (ja) Sacコントローラ
JP3039814B2 (ja) 学習制御方式
JP3036654B2 (ja) 学習制御方式
JP3599127B2 (ja) オブザーバ制御演算装置
JP3039573B2 (ja) 学習制御方式
JP3152251B2 (ja) 増分値演算による学習制御方法
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP3234109B2 (ja) プロセス制御装置
JP2876702B2 (ja) 学習制御方法
JP2827792B2 (ja) 帰還制御装置及び制御方法
JP3513989B2 (ja) 位置決め制御系の指令補間方法
JPH01237701A (ja) 周期的目標値に最適に追従する制御方法
JP2817538B2 (ja) 帰還制御装置及び制御方法
JP3224941B2 (ja) ディジタルpid制御装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090525

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100525

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees