JP3191836B2

JP3191836B2 - 学習制御装置

Info

Publication number: JP3191836B2
Application number: JP13546993A
Authority: JP
Inventors: 裕司中村
Original assignee: Yaskawa Electric Corp
Current assignee: Yaskawa Electric Corp
Priority date: 1993-05-12
Filing date: 1993-05-12
Publication date: 2001-07-23
Anticipated expiration: 2016-07-23
Also published as: JPH06324710A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、工作機械、ロボット等
の制御装置に関する。

【０００２】

【従来の技術】繰り返し目標値に対する学習制御装置と
しては、本出願人が特開平1ー237701号公報、特願平03-1
77230 、および、特願平04-289431 において提案した装
置がある。これらの装置では、同じ目標値に対する動作
を繰り返し、偏差、補正量、制御入力、および、制御対
象のステップ応答をもとに未来偏差予測値が最小となる
ように制御入力が決定されるため、最終的には目標値と
出力が一致し、高精度な追従動作が実現される。

【０００３】

【発明が解決しようとする課題】しかし従来技術では、
未来偏差の予測の際に、制御対象の十分整定するまでの
ステップ応答が必要であり、制御対象の伝達関数モデル
が得られている場合、シミュレーション等によりステッ
プ応答を算出することも考えられるが、直接的でなく、
その分の手間がかかり、さらに、整定時間の増加やサン
プリング周期の短縮に伴って演算量が増加するなどの問
題があった。そこで本発明は、伝達関数モデルを直接利
用し、演算量の少ない学習制御装置を提供することを目
的とする。

【０００４】

【課題を解決するための手段】上記問題点を解決するた
め、本願第１の発明では、周期Ｌで同じパターンを繰り
返す目標指令に、伝達関数モデルが、Ｇp(z) = (b₁z ^-1 + … + b_Nbz ^-Nb) / (1 - a₁z^-1
- … - a_Naz ^-Na) である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令ｒ(i)（= ｒ(i') i'=i-L ）と、D(D
≧0)サンプリング前の制御対象の出力ｙ(i-D) を入力
し、制御入力ｕ(i) を制御対象へ出力する学習制御装置
において、１周期前の制御入力ｕ(i')に補正量σ(i) を
加算して、ｕ(i) 求める手段と、目標指令を記憶し、偏
差ｅ(i-D) を求める手段と、学習制御用定数を記憶する
手段と、偏差、補正量、制御入力の時系列データを記憶
する手段と、前記時系列データと制御対象の伝達関数モ
デルにより、Ｍサンプリング未来までの偏差予測値ｅ^*
と偏差ｅ(i-D) および補正量σ(i) に関する評価関数

【０００５】

【数２３】

【０００６】ただし、Δはサンプリング周期間の増分値
を表し（Δσ(i)=σ(i)-σ(i-1)）、w _m 、αは偏差に掛
ける係数、cおよびcdは補正量およびその増分値に掛け
る係数である。が最小となるように、現在時刻の補正量
σ(i) を決定する手段とを備えたことを特徴とし、本願
第２の発明では、周期Ｌで同じパターンを繰り返す目標
指令に、伝達関数モデルが、Ｇp(z) = (b₁z^-1 + … + b_Nbz^-Nb )/ (1 - a₁z^-1 - … - a_Naz^-Na ) である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令増分値Δｒ(i) （= Δｒ(i') i'=i-L
）と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δｙ(i-D) を入力し、制御入力ｕ(i)を制御対象へ出
力する学習制御装置において、１周期前の制御入力増分
値Δｕ(i')に補正量増分値Δσ(i) を加算して、Δｕ
(i) 求める手段と、目標指令増分値を記憶し、偏差増分
値および偏差を求める手段と、補正量増分値より補正量
を求める手段と、学習制御用定数を記憶する手段と、偏
差増分値、補正量増分値、制御入力増分値の時系列デー
タを記憶する手段と、前記偏差と補正量と時系列データ
と制御対象の伝達関数モデルにより、Ｍサンプリング未
来までの偏差増分値の予測値Δｅ^* と偏差ｅおよび補正
量に関する評価関数

【０００７】

【数２４】

【０００８】（ただし、σ(i)=σ(i-1)+Δσ(i)、w _m 、
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。)が最小となるように、現
在時刻の補正量増分値Δσ(i) を決定する手段と、制御
入力増分値より制御入力を求める手段とを備えたことを
特徴とし、本願第３の発明では、周期Ｌで同じパターン
を繰り返す目標指令に、伝達関数モデルが、Ｇp(z) = (b₁z^-1 +…+b_Nbz^-Nb ) / ｛(1-z^-1 )(1-a₁z^-1-…-a_Naz^-Na ) ｝である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令増分値Δｒ(i) （= Δｒ(i') i'=i-L
）と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δｙ(i-D) を入力し、制御入力ｕ(i)を制御対象へ出
力する学習制御装置において、１周期前の制御入力ｕ
(i')に補正量σ(i) を加算して、ｕ(i) を求める手段
と、目標指令増分値を記憶し、偏差増分値および偏差を
求める手段と、学習制御用定数を記憶する手段と、偏差
増分値、補正量、制御入力の時系列データを記憶する手
段と、前記偏差と時系列データと制御対象の伝達関数モ
デルにより、Ｍサンプリング未来までの偏差増分値の予
測値Δｅ^* と偏差ｅおよび補正量に関する評価関数

【０００９】

【数２５】

【００１０】（ただし、w _m 、αは偏差に掛ける係数、c
およびcd は補正量およびその増分値に掛ける係数であ
る。）が最小となるように、現在時刻の補正量σ(i)を
決定する手段とを備えたことを特徴とする。

【００１１】

【作用】上記手段により、伝達関数モデルを直接利用
し、演算量の少ない学習制御装置が実現され、高精度な
追従動作が可能となる。

【００１２】

【実施例】まず、本願第１の発明の具体的実施例を図１
に示して説明する。図中１は本発明の学習制御装置であ
り、現在時刻ｉにおいて、周期Ｌで同じパターンを繰り
返す目標指令の現在値ｒ(i) （= ｒ(i') i'=i-L ）と、
D(D ≧0)サンプリング前の制御対象の出力ｙ(i-D) を入
力し、制御入力ｕ(i) を制御対象へ出力する。２は、目
標指令ｒ(i),ｒ(i-1),…, ｒ(i-D) を記憶するメモリ、
８は、メモリ２に記憶された目標指令ｒ(i-D) と、出力
ｙ(i-D) との差ｅ(i-D) を求める減算器である。３は、
定数Ｅ, ｑ_M1 ,…, ｑ_M, ｐ₀,…, ｐ_Na, ｇ₁,…, ｇ
_Nb+Dを記憶するメモリ、４は過去の偏差を記憶するメモ
リであり、減算器８の出力ｅ(i-D) が新たに記憶され
る。５は過去の補正量を記憶するメモリ、６は１周期前
の時刻i'までの過去の制御入力を記憶するメモリであ
る。７は演算器であり、

【００１３】

【数２６】

【００１４】なる演算によって補正量σ(i) を算出す
る。算出されたσ(i) は、加算器９に入力されるととも
にメモリ５に記憶される。加算器９は、演算器７の出力
σ(i) とメモリ６に記憶されたｕ(i')とを加算して制御
入力ｕ(i) を算出する。得られた制御入力ｕ(i) は、学
習制御装置１の出力として制御対象に出力されるととも
に、メモリ６に記憶される。ここで(1) 式の導出を行
う。時刻ｉにおいて、制御入力ｕ(i) は、加算器９によ
り次式で決定される。ｕ(i) = ｕ(i') + σ(i) (2) そこで、未来偏差予測値ｅ^*(i+m) (1≦M1≦m ≦M)が最
小となるように、現在時刻の補正量σ(i) を決定するこ
とを考える。いま制御対象の伝達関数モデルが、Ｇp(z) = (b₁z ^-1 + … + b_Nbz ^-Nb) / (1 - a₁z^-1
- … - a_Naz ^-Na) の離散時間系で得られているとすると、その入出力間モ
デルは次式となる。

【００１５】

【数２７】

【００１６】上式のモデルを用いれば、 δ(i) = ｙ(i) - ｙ(i') (4) で定義される出力変化分δ(i) のモデルは次式となる。

【００１７】

【数２８】

【００１８】時刻ｉにおいては、時刻i-D までの出力変
化分実測値δ(i-n) (n≧D) が得られているため、それ
以降の

【００１９】

【数２９】

【００２０】を、実測値を用いて表すと、

【００２１】

【数３０】

【００２２】より、次式となる。

【００２３】

【数３１】

【００２４】（ただし、 a_n=0 (n> N_a), b_n=0 (n<1
およびn> N_b) ）で与えられる。またσ(j)=σ(i) (j>
i) とすると、(9b)式の

【００２５】

【数３２】

【００２６】は次式となる。

【００２７】

【数３３】

【００２８】そこで時刻i-D 以降の出力変化分を

【００２９】

【数３４】

【００３０】で予測すると、出力変化分予測値δ^*(i+
m) は、

【００３１】

【数３５】

【００３２】で表され、係数 A_mn, B_mnは、次式で与え
られる。

【００３３】

【数３６】

【００３４】この場合、(11)式の係数 A_mn,B_mnは、σ
(j)=0 (j>i) とすると、

【００３５】

【数３７】

【００３６】（ただし、 a_n=0 (n> N_a), b_n=0 (n<1
およびn> N_b) ）で与えられ、σ(j)=σ(i) (j>i) とす
ると、(14b) 式の B_m0は次式となる。

【００３７】

【数３８】

【００３８】以上より、出力変化分予測値δ^*(i+m) (m
≧-D+1) は(11)式で与えられ、その係数 A_mn, B_mnは、
(8),(9),(12)式、あるいは(13),(14) 式で求められる。
したがって、未来偏差予測値ｅ^*(i+m) を、

【００３９】

【数３９】

【００４０】で与え、評価関数

【００４１】

【数４０】

【００４２】（ただし、Δσ(i)=σ(i)-σ(i-1)、w _m 、
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。）が最小となるように、補
正量σ(i) を決定すると、∂Ｊ/ ∂σ(i) = 0 より、前
記(1) 式を得る。ただし各定数、ｑ_m , ｐ_n, Ｅ, ｇ_n
は、次式で与えられる。

【００４３】

【数４１】

【００４４】ところで、偏差ｅ(i-D) から制御入力ｕ
(i) までの伝達関数Ｇu(z)は、ｐ₀+Ｅを改めてｐ₀と置
くと、(1),(2) 式より次式となる。

【００４５】

【数４２】

【００４６】したがって、減算器８の出力信号ｅ(i-D)
から制御入力ｕ(i) までの伝達関数が(18)式となるよう
制御入力を決定する手段を備えていれば、図１の実施例
以外の構成でも、同様の効果を持つ学習制御器が実現さ
れる。さらに制御系の安定性を高めるために、上式のz
^-L部分をＦ(z)z^-Lとしても良い。ここでＦ(z) は、ロー
パスフィルタの伝達関数である。また、出力変化分予測
値δ^*(i+m) を、(11)式の代わりに(5) 式と次式

【００４７】

【数４３】

【００４８】（ただし A_mn,B_mnは、(8),(9),(9')式でD=
0 としたときの

【００４９】

【数４４】

【００５０】の値）によって与え、未来偏差予測値をｅ
^*(i+m)=ｅ(i'+m)- δ^*(i+m) として、(16)式の評価関
数（ただしα=0）を最小とするよう補正量を決定すれ
ば、各試行を間欠的に行い各試行間に次回１試行分の補
正量を(5) 式と次式によりまとめて算出することもでき
る。

【００５１】

【数４５】

【００５２】（ただし、ｑ_m, ｐ_n, ｇ_nは(17)式でD=
0 としたときの値である）つぎに、本願第２の発明の具
体的実施例を図２に示して説明する。図中２１は本発明
の学習制御装置であり、現在時刻ｉにおいて、周期Ｌで
同じパターンを繰り返す目標指令の増分値Δｒ(i) （=
Δｒ(i') i'=i-L ）と、D(D ≧0)サンプリング前の制御
対象の出力増分値Δｙ(i-D) を入力し、制御入力ｕ(i)
を制御対象へ出力する。Δは、サンプリング周期間の増
分値を表す。２２は、目標指令増分値Δｒ(i),…, Δｒ
(i-D) を記憶するメモリ、２８は、メモリ２２に記憶さ
れたΔｒ(i-D) と、Δｙ(i-D) との差Δｅ(i-D) を求め
る減算器であり、３０はΔｅ(i-D) よりｅ(i-D) を求め
る積算器である。２３は定数ｖ_-D+1 ,…, ｖ_M, ｐ₀,
…, ｐ_Na-1 ,Ｅ, ｇ₁,…, ｇ_Nb+D-1 ,Ｓを記憶するメモ
リ、２４は過去の偏差増分値を記憶するメモリであり、
減算器２８の出力Δｅ(i-D) が新たに記憶される。２５
は過去の補正量増分値を記憶するメモリ、３１は補正量
σ(i-1) を求める積算器、２６は１周期前の時刻i'まで
の過去の制御入力増分値を記憶するメモリである。２７
は演算器であり、

【００５３】

【数４６】

【００５４】なる演算により補正量増分値Δσ(i) を算
出する。算出されたΔσ(i) は、加算器２９と積算器３
１に入力されるとともにメモリ２５に記憶される。加算
器２９は、演算器２７の出力Δσ(i) とメモリ２６に記
憶されたΔｕ(i')とを加算して制御入力増分値Δｕ(i)
を算出する。得られたΔｕ(i) は、積算器３２に入力さ
れるとともに、メモリ２６に記憶される。積算器３２に
よって求められた制御入力ｕ(i) は、学習制御装置２１
の出力として制御対象に出力される。ここで(21)式の導
出を行う。時刻ｉにおいて、制御入力増分値Δｕ(i)
は、加算器２９により次式で決定される。 Δｕ(i) = Δｕ(i') + Δσ(i) (22) そこで、未来偏差予測値が最小となるように、現在時刻
の補正量増分値Δσ(i)を決定することを考える。い
ま制御対象の伝達関数モデルが、Ｇp(z) = (b₁z ^-1 + … + b_Nbz ^-Nb) / (1 - a₁z^-1
- … - a_Naz ^-Na) の離散時間系で得られているとすると、その入出力増分
値モデルは次式となる。

【００５５】

【数４７】

【００５６】上式のモデルを用いれば、 Δδ(i) = Δｙ(i) - Δｙ(i') (24) で定義される出力増分値変化分Δδ(i) のモデルは次式
となる。

【００５７】

【数４８】

【００５８】時刻ｉにおいては、時刻i-D までの変化分
実測値Δδ(i-n) (n≧D)が得られているため、それ以降
の変化分を実測値を用いて、

【００５９】

【数４９】

【００６０】で予測すると、変化分予測値Δδ^*(i+m)
は、次式となる。

【００６１】

【数５０】

【００６２】ここで係数 A_mn, B_mnは、未来の補正量増
分値をΔσ(j)=0 (j>i) とすると、

【００６３】

【数５１】

【００６４】（ただし、 a_n=0 (n> N_a), b_n=0 (n<1
およびn> N_b) ）で与えられる。したがって、偏差増分
値の予測値Δｅ^*(i+m) を、(24),(27) 式より、

【００６５】

【数５２】

【００６６】で与え、評価関数

【００６７】

【数５３】

【００６８】（ただし、σ(i)=σ(i-1)+Δσ(i) 、w _m 、
αは偏差に掛ける係数、cおよびcdは補正量およびその
増分値に掛ける係数である。）が最小となるように、補
正量増分値Δσ(i) を決定すると、∂Ｊ/ ∂Δσ(i)=0
より、前記(21)式を得る。ただし各定数、ｖ_m , ｐ_n,
Ｅ, ｇ_n , Ｓは次式で与えられる。

【００６９】

【数５４】

【００７０】ところで、偏差Δｅ(i-D) から制御入力増
分値Δｕ(i) までの伝達関数Ｇu(z)は、(21),(22) 式よ
り

【００７１】

【数５５】

【００７２】となるため、減算器２８の出力信号Δｅ(i
-D) から制御入力増分値Δｕ(i) までの伝達関数が(33)
式となるよう制御入力増分値を決定し、積算して制御入
力を求める手段を備えていれば、図２の実施例以外の構
成でも、同様の効果を持つ学習制御器が実現される。さ
らに制御系の安定性を高めるために、上式のz ^-L部分を
Ｆ(z)z^-Lとしても良い。ここでＦ(z) は、ローパスフィ
ルタの伝達関数である。また、変化分予測値Δδ^*(i+
m) を、(27)式の代わりに(25)式と次式

【００７３】

【数５６】

【００７４】（ただし A_mn,B_mnは、(28),(29) 式でD=0
としたときの値）によって与え、偏差増分値の予測値を
Δｅ^*(i+m)=Δｅ(i'+m)- Δδ^*(i+m) として、評価関
数

【００７５】

【数５７】

【００７６】（ただし、w _m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。）を最小とするよう補正量増分値を決定すれば、各
試行を間欠的に行い各試行間に次回１試行分の補正量増
分値を(25),(34) 式と次式によりまとめて算出すること
もできる。

【００７７】

【数５８】

【００７８】ただし、ｖ_m, ｐ_n, Ｅ, ｇ_n, Ｓは(32)
式でD=0 としたときの値である。つぎに、本願第３の発
明の具体的実施例を図３に示して説明する。図中４１は
本発明の学習制御装置であり、現在時刻ｉにおいて、周
期Ｌで同じパターンを繰り返す目標指令の増分値Δｒ
(i) （= Δｒ(i') i'=i-L ）と、D(D ≧0)サンプリング
前の制御対象の出力増分値Δｙ(i-D) を入力し、制御入
力ｕ(i) を制御対象へ出力する。Δは、サンプリング周
期間の増分値を表す。４２は、目標指令増分値Δｒ(i),
…, Δｒ(i-D) を記憶するメモリ、４８は、メモリ４２
に記憶されたΔｒ(i-D) と、Δｙ(i-D) との差Δｅ(i-
D) を求める減算器であり、５０はΔｅ(i-D) よりｅ(i-
D) を求める積算器である。４３は定数ｖ_-D+1 ,…, ｖ
_M, ｐ₀,…, ｐ_Na-1 ,Ｅ, ｇ₁,…, ｇ_Nb+D-1を記憶する
メモリ、４４は過去の偏差増分値を記憶するメモリであ
り、減算器４８の出力Δｅ(i-D) が新たに記憶される。
４５は過去の補正量を記憶するメモリ、４６は１周期前
の時刻i'までの過去の制御入力を記憶するメモリであ
る。４７は演算器であり、

【００７９】

【数５９】

【００８０】なる演算により補正量σ(i) を算出する。
算出されたσ(i) は、加算器４９に入力されるとともに
メモリ４５に記憶される。加算器４９は、演算器４７の
出力σ(i) とメモリ４６に記憶されたｕ(i')とを加算し
て制御入力ｕ(i) を算出する。得られたｕ(i) は、学習
制御装置４１の出力として制御対象に出力されるととも
に、メモリ４６に記憶される。ここで(41)式の導出を行
う。時刻ｉにおいて、制御入力ｕ(i) は、加算器４９に
より次式で決定される。ｕ(i) = ｕ(i') + σ(i) (42) そこで、未来偏差予測値が最小となるように、現在時刻
の補正量σ(i) を決定することを考える。いま制御対象
の伝達関数モデルが、Ｇp(z) = (b₁z ^-1 +…+b_Nbz ^-Nb) / ｛(1-z^-1 )(1-a₁z
^-1 -…-a_Naz ^-Na) ｝の離散時間系で得られているとすると、その入出力モデ
ルは次式となる。

【００８１】

【数６０】

【００８２】上式のモデルを用いれば、 Δδ(i) = Δｙ(i) - Δｙ(i') (44) で定義される出力増分値変化分Δδ(i) のモデルは次式
となる。

【００８３】

【数６１】

【００８４】時刻ｉにおいては、時刻i-D までの変化分
実測値Δδ(i-n) (n≧D)が得られているため、それ以降
の変化分を実測値を用いて、

【００８５】

【数６２】

【００８６】で予測すると、変化分予測値Δδ^*(i+m)
は、次式となる。

【００８７】

【数６３】

【００８８】ここで係数 A_mn, B_mnは、未来の補正量を
σ(j)=0 (j>i) とすると、

【００８９】

【数６４】

【００９０】（ただし、 a_n=0 (n> N_a), b_n=0 (n<1
およびn> N_b) ）で与えられる。またσ(j)=σ(i) (j>
i) とすると、(49b) 式の B_m0は次式となる。

【００９１】

【数６５】

【００９２】したがって、偏差増分値の予測値Δｅ^*(i
+m) を、(44),(47) 式より、

【００９３】

【数６６】

【００９４】で与え、評価関数

【００９５】

【数６７】

【００９６】（ただし、w _m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。）が最小となるように、補正量σ(i) を決定する
と、∂Ｊ/ ∂σ(i)=0 より、前記(41)式を得る。ただし
各定数、ｖ_m , ｐ_n, Ｅ, ｇ_n は次式で与えられる。

【００９７】

【数６８】

【００９８】(41)式は、補正量増分値Δσを用いて、

【００９９】

【数６９】

【０１００】と書き直すこともできる。ただし、Ｇ_nは
(52)式のｇ_nより次式で与えられる。

【０１０１】

【数７０】

【０１０２】ところで、偏差Δｅ(i-D) から制御入力ｕ
(i) までの伝達関数Ｇu(z)は、(41),(42) 式より

【０１０３】

【数７１】

【０１０４】となるため、減算器４８の出力信号Δｅ(i
-D) から制御入力ｕ(i) までの伝達関数が(53)式となる
よう制御入力を決定する手段を備えていれば、図３の実
施例以外の構成でも、同様の効果を持つ学習制御器が実
現される。さらに制御系の安定性を高めるために、上式
のz ^-L部分をＦ(z)z^-Lとしても良い。ここでＦ(z) は、
ローパスフィルタの伝達関数である。また、変化分予測
値Δδ^*(i+m) を、(47)式の代わりに(45)式と次式

【０１０５】

【数７２】

【０１０６】（ただし A_mn,B_mnは、(48),(49),(49b) 式
でD=0 としたときの値）によって与え、偏差増分値の予
測値をΔｅ^*(i+m)=Δｅ(i'+m)- Δδ^*(i+m) として、
評価関数

【０１０７】

【数７３】

【０１０８】（ただし、w _m 、αは偏差に掛ける係数、c
およびcdは補正量およびその増分値に掛ける係数であ
る。）を最小とするよう補正量を決定すれば、各試行を
間欠的に行い各試行間に次回１試行分の補正量を(45),
(54) 式と次式によりまとめて算出することもできる。

【０１０９】

【数７４】

【０１１０】ただし、ｖ_m, ｐ_n, Ｅ, ｇ_nは(52)式で
D=0 としたときの値である。

【０１１１】

【発明の効果】以上述べたように本発明によれば、伝達
関数モデルを直接利用し、演算量の少ない学習制御装置
が実現され、高精度な追従動作が可能となるという効果
がある。

【図面の簡単な説明】

【図１】本願第１の発明の具体的実施例を示す図

【図２】本願第２の発明の具体的実施例を示す図

【図３】本願第３の発明の具体的実施例を示す図

【符号の説明】

１学習制御装置２目標指令を記憶するメモリ３定数を記憶するメモリ４偏差を記憶するメモリ５補正量を記憶するメモリ６制御入力を記憶するメモリ７演算器８減算器９加算器

Claims

(57)【特許請求の範囲】

【請求項１】周期Ｌで同じパターンを繰り返す目標指令
に、伝達関数モデルが、Ｇp(z) = (b₁z^-1 + … + b_Nbz^-Nb )/ (1 - a₁z^-1 - … - a_Naz^-Na ) である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令ｒ(i)（= ｒ(i') i'=i-L ）と、D(D
≧0)サンプリング前の制御対象の出力ｙ(i-D) を入力
し、制御入力ｕ(i) を制御対象へ出力する学習制御装置
において、１周期前の制御入力ｕ(i')に補正量σ(i) を加算してｕ
(i) を求める手段と、目標指令を記憶して偏差ｅ(i-D) を求める手段と、学習制御用定数を記憶する手段と、偏差、補正量、制御入力の時系列データを記憶する手段
と、前記時系列データと制御対象の伝達関数モデルにより、
Ｍサンプリング未来までの偏差予測値ｅ^* と偏差ｅ(i-
D) および補正量σ(i) に関する評価関数【数１】（ただし、Δはサンプリング周期間の増分値を表す（Δ
σ(i)=σ(i)-σ(i-1)、w _m 、αは偏差に掛ける係数、cお
よびcd は補正量およびその増分値に掛ける係数であ
る。）が最小となるように、現在時刻の補正量σ(i) を決定す
る手段とを備えたことを特徴とする学習制御装置。
【請求項２】現在時刻の補正量σ(i) を【数２】（ここで、ｑ_m , ｐ_n, Ｅ, ｇ_n は学習制御用定数）として決定する手段を備えたことを特徴とする請求項１
記載の学習制御装置。
【請求項３】請求項１のｕ(i) を求める手段に代え
て、偏差ｅ(i-D) から制御入力ｕ(i) までの伝達関数が【数３】（ここで、ｑ_m , ｐ_n , ｇ_n は学習制御用定数、Ｆ(z)
はローパスフィルタの伝達関数または１）となるよう制御入力ｕ(i) を決定する手段を備えたこと
を特徴とする請求項１記載の学習制御装置。
【請求項４】請求項１のｕ(i) を求める手段に代え
て、１周期ごとの各試行を間欠的に行い、各試行間に前
記伝達関数モデルにより、制御対象出力の前回試行時か
らの変化分【数４】を算出し記憶する手段と、次回試行分の制御入力をｕ(i) = ｕ(i') + σ(i) 【数５】（ここでｑ_m , ｐ_n , ｇ_n は学習制御用定数）により１試行分まとめて決定する手段とを備えることを
特徴とする請求項１記載の学習制御装置。
【請求項５】周期Ｌで同じパターンを繰り返す目標指
令に、伝達関数モデルが、Ｇp(z) = (b₁z^-1 + … + b_Nbz^-Nb )/ (1 - a₁z^-1 - … - a_Naz^-Na ) である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令増分値Δｒ(i) （= Δｒ(i') i'=i-L
）と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δｙ(i-D) を入力し、制御入力ｕ(i)を制御対象へ出
力する学習制御装置において、１周期前の制御入力増分値Δｕ(i')に補正量増分値Δσ
(i) を加算してΔｕ(i) を求める手段と、目標指令増分値を記憶して偏差増分値および偏差を求め
る手段と、補正量増分値より補正量を求める手段と、学習制御用定数を記憶する手段と、偏差増分値、補正量増分値、制御入力増分値の時系列デ
ータを記憶する手段と、前記偏差と補正量と時系列データと制御対象の伝達関数
モデルにより、Ｍサンプリング未来までの偏差増分値の
予測値Δｅ^*と偏差ｅおよび補正量に関する評価関数【数６】（ただし、σ(i)=σ(i-1)+Δσ(i) 、w _m 、αは偏差に掛
ける係数、cおよびcdは補正量およびその増分値に掛け
る係数である。）が最小となるように、現在時刻の補正量増分値Δσ(i)
を決定する手段と、制御入力増分値より制御入力を求める手段とを備えたこ
とを特徴とする学習制御装置。
【請求項６】現在時刻の補正量増分値Δσ(i) を【数７】（ここで、ｖ_m, ｐ_n,Ｅ, ｇ_n , Ｓは学習制御用定
数）として決定する手段を備えたことを特徴とする請求項５
記載の学習制御装置。
【請求項７】請求項５の制御入力増分値Δｕ(i) を決
定する手段に代えて、偏差増分値Δｅ(i-D) から制御入
力増分値Δｕ(i) までの伝達関数が【数８】（ここで、ｖ_m , ｐ_n , Ｅ, ｇ_n ,Ｓは学習制御用定
数、Ｆ(z) はローパスフィルタの伝達関数または１）となるよう制御入力増分値Δｕ(i) を決定する手段を備
えたことを特徴とする請求項５記載の学習制御装置。
【請求項８】請求項５の補正量増分値Δσ(i) を決定
する手段および制御入力増分値Δｕ(i) を決定する手段
に代えて、１周期ごとの各試行を間欠的に行い、各試行
間に前記伝達関数モデルにより制御対象出力増分値の前回試
行時からの変化分【数９】を算出し記憶する手段と、変化分【数１０】と前回試行時の偏差増分値より偏差【数１１】を求め記憶する手段と、評価関数【数１２】（ただし、w _m , αは偏差に掛ける係数，cおよびcd は補
正量およびその増分値に掛ける係数である。）を最小とするよう次回試行分の制御入力をｕ(i) = ｕ(i-1) + Δｕ(i) Δｕ(i) = Δｕ(i') + Δσ(i) 【数１３】（ここでｖ_m , ｐ_n, Ｅ, ｇ_n , Ｓは学習制御用定数）により１試行分まとめて決定する手段とを備えることを
特徴とする請求項５記載の学習制御装置。
【請求項９】周期Ｌで同じパターンを繰り返す目標指
令に、伝達関数モデルが、Ｇp(z) = (b₁z^-1 +…+b_Nbz^-Nb ) / ｛(1-z^-1 )(1-a₁z^-1 -…-a_Naz^-Na ) ｝である制御対象の出力を追従させるよう、現在時刻ｉに
おいて、目標指令増分値Δｒ(i) （= Δｒ(i') i'=i-L
）と、D(D ≧0)サンプリング前の制御対象の出力増分
値Δｙ(i-D) を入力し、制御入力ｕ(i)を制御対象へ出
力する学習制御装置において、１周期前の制御入力ｕ(i')に補正量σ(i) を加算してｕ
(i) を求める手段と、目標指令増分値を記憶して偏差増分値および偏差を求め
る手段と、学習制御用定数を記憶する手段と、偏差増分値、補正量、制御入力の時系列データを記憶す
る手段と、前記偏差と時系列データと制御対象の伝達関数モデルに
より、Ｍサンプリング未来までの偏差増分値の予測値Δ
ｅ^*と偏差ｅおよび補正量に関する評価関数【数１４】（ただし、w _m 、αは偏差に掛ける係数、cおよびcd は補
正量およびその増分値に掛ける係数である。）が最小となるように、現在時刻の補正量σ(i) を決定す
る手段とを備えたことを特徴とする学習制御装置。
【請求項１０】現在時刻の補正量σ(i) を【数１５】（ここで、ｖ_m , ｐ_n, Ｅ, ｇ_n は学習制御用定数）として決定する手段を備えたことを特徴とする請求項９
記載の学習制御装置。
【請求項１１】補正量増分値の時系列データを記憶す
る手段と、現在時刻の補正量σ(i) を【数１６】（ここで、ｖ_m , ｐ_n , Ｅ, Ｇ_n は学習制御用定数）として決定する手段とを備えたことを特徴とする請求項
９記載の学習制御装置。
【請求項１２】請求項９の制御入力ｕ(i) を決定する
手段に代えて、偏差増分値Δｅ(i-D) から制御入力ｕ
(i) までの伝達関数が【数１７】（ここで、ｖ_m , ｐ_n , Ｅ, ｇ_n は学習制御用定数、Ｆ
(z)はローパスフィルタの伝達関数または１）となるよう制御入力ｕ(i) を決定する手段を備えたこと
を特徴とする請求項９記載の学習制御装置。
【請求項１３】請求項９の現在時刻の補正量σ(i) を
決定する手段および制御入力ｕ(i) を決定する手段に代
えて、１周期ごとの各試行を間欠的に行い、各試行間に前記伝達関数モデルにより制御対象出力増分値の前回試
行時からの変化分【数１８】を算出し記憶する手段と、変化分【数１９】と前回試行時の偏差増分値より偏差【数２０】を求め記憶する手段と、評価関数【数２１】（ただし、w _m 、αは偏差に掛ける係数、cおよびcd は補
正量およびその増分値に掛ける係数である。）を最小とするよう次回試行分の制御入力をｕ(i) = ｕ(i') + σ(i) 【数２２】（ここでｖ_m, ｐ_n , Ｅ, ｇ_n は学習制御用定数）により１試行分まとめて決定する手段とを備えることを
特徴とする請求項９記載の学習制御装置。