JP3256950B2 - 最適予見学習制御装置 - Google Patents

最適予見学習制御装置

Info

Publication number
JP3256950B2
JP3256950B2 JP30754293A JP30754293A JP3256950B2 JP 3256950 B2 JP3256950 B2 JP 3256950B2 JP 30754293 A JP30754293 A JP 30754293A JP 30754293 A JP30754293 A JP 30754293A JP 3256950 B2 JP3256950 B2 JP 3256950B2
Authority
JP
Japan
Prior art keywords
vector
output
control
dimensional
learning control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP30754293A
Other languages
English (en)
Other versions
JPH07141004A (ja
Inventor
裕司 中村
慎悟 安藤
悦二郎 示村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP30754293A priority Critical patent/JP3256950B2/ja
Publication of JPH07141004A publication Critical patent/JPH07141004A/ja
Application granted granted Critical
Publication of JP3256950B2 publication Critical patent/JP3256950B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、工作機械、ロボット等
の制御装置に関する。
【0002】
【従来の技術】繰り返し目標指令に対する学習制御装置
としては、本出願人が特願平3-177230、特願平5-13546
9、および、特願平5-125311において提案した装置があ
る。これらの装置では、同じ目標指令に対する動作を繰
り返し、偏差、補正量、制御入力、および、制御対象の
動特性モデルをもとに未来偏差予測値が最小となるよう
に制御入力が決定されるため、最終的には目標値と出力
が一致し、高精度な追従動作が実現される。
【0003】
【発明が解決しようとする課題】しかし、特願平3-1772
30および特願平05-135469 では、動特性モデルとして、
ステップ応答および伝達関数を用いており、制御対象の
状態空間モデルが得られている場合、それぞれのモデル
に変換することも考えられるが、直接的でなく、その分
の手間がかかってしまう。さらに、特願平3-177230では
十分整定するまでのステップ応答が必要であるため、整
定時間の増加やサンプリング周期の短縮に伴って演算量
が増加するという問題があった。特願平05-125311 で
は、動特性モデルとして状態空間モデルを用いることに
より、この問題を解決しているが、状態空間モデルに対
する有効な設計法として知られている最適レギュレータ
の構成とはなっていない。また、これら3つの従来技術
は、1入力1出力系を対象としており、多入力多出力系
には適用できない。そこで本発明は、状態空間モデルを
直接利用し、演算量が少なく、多入力多出力の制御対象
に適用でき、さらに、その内部に最適レギュレータ系を
持つ学習制御装置を提供することを目的とする。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本発明では、m個の入力とp個の出力を持ち、状態
空間表現 x(i+1) = Ax(i) + Bu(i) y(i) = Cx(i) で表される制御対象の出力ベクトルyを、周期Lで同じ
パターンを繰り返す目標指令ベクトルrに追従させるよ
う、現在時刻iにおいて、目標指令ベクトルr(i) と、
制御対象の出力ベクトルy(i) および状態ベクトルx
(i) を入力し、制御入力ベクトルu(i) を制御対象へ出
力する学習制御装置において、目標指令ベクトルと出力
ベクトルより、偏差ベクトルe(i) を求める手段と、学
習制御用定数行列を記憶する手段と、評価関数
【0005】
【数6】
【0006】(ここで、x。(i)=CT(CCT) -1r(i)-x(i)、η
(i)=x(i)-x(i-L)、σ(i)=u(i)-u(i-L)であり、Q,R,Hは重
み行列である)が最小となるように、現在時刻の制御入
力ベクトルu(i)を決定する手段と、偏差ベクトルおよび
制御入力ベクトルの時系列データを記憶する手段と、
態ベクトルxを記憶して、その1周期前からの変化分η
を求める手段と、 現在時刻の制御入力ベクトルu(i)を
【数22】 (ここで、K、Ψ k は学習制御用定数行列であり、特に
Kは制御対象に対して最適レギュレータを構成した場合
のフィードバックゲイン行列である)として決定する手
段と、を備えることにより、最適レギュレータ系を備え
たことを特徴とするものである。
【0007】
【作用】上記手段により、多入力多出力の制御対象に対
して、状態空間モデルを直接利用し、演算量が少なく、
さらに、最適レギュレータが持つ最適性を有した学習制
御装置が実現され、高精度な追従動作が可能となる。
【0008】
【実施例】本発明の具体的実施例を図1、図2、図3に
示して説明する。まず図1において、1は本発明の学習
制御装置であり、現在時刻iにおいて、周期Lで同じパ
ターンを繰り返す目標指令ベクトルの現在値r(i) と、
制御対象の出力ベクトルy(i) および状態ベクトルx
(i) を入力し、制御入力ベクトルu(i) を制御対象へ出
力する。7は、目標指令ベクトルr(i) と出力ベクトル
y(i) との偏差ベクトルe(i)を求める減算器、2は、
学習制御用定数行列K、Ψ1,…, ΨM を記憶するメモ
リ、3は、1周期分の偏差ベクトルを記憶するメモリで
あり、減算器7の出力e(i) が新たに記憶される。4
は、1周期分の状態ベクトルを記憶するメモリであり、
8は、メモリ4に記憶された状態ベクトルx(i-L) と、
x(i) との差η(i) を求める減算器である。5は、1周
期分の制御入力ベクトルを記憶するメモリである。6は
演算器であり、
【0009】
【数7】
【0010】なる演算によって制御入力ベクトルu(i)
を算出する。算出されたu(i) は、学習制御装置1の出
力として制御対象に出力されるとともに、メモリ5に記
憶される。つぎに図2について説明する。11は本発明
の学習制御装置であり、2、3、7は、図1と同じであ
る。12は、1周期分のm次元ベクトルvを記憶するメ
モリである。13は演算器であり、
【0011】
【数8】
【0012】なる演算によって、ベクトルv(i) および
制御入力ベクトルu(i) を算出する。算出されたv(i)
はメモリ12に記憶され、u(i) は、学習制御装置11
の出力として制御対象に出力される。さらに図3につい
て説明する。21は本発明の学習制御装置であり、2、
7は、図1と同じである。22は、1周期分のp次元ベ
クトルwを記憶するメモリであり、24は、メモリ22
に記憶されたベクトルw(i-L) と、偏差ベクトルe(i)
との和を求める加算器である。加算器24の出力は、メ
モリ22にw(i) として新たに記憶される。23は演算
器であり、
【0013】
【数9】
【0014】なる演算によって制御入力ベクトルu(i)
を算出する。算出されたu(i) は、学習制御装置21の
出力として制御対象に出力される。ここで(1),(2),(3)
式の導出を行う。次式の状態空間表現
【0015】
【数10】
【0016】(x(i) ∈Rnx1,u(i) ∈Rmx1,y(i) ∈
px1 はそれぞれ状態, 入力, 出力ベクトル)で表され
る制御対象の出力ベクトルyと、周期Lで同じパターン
を繰り返す目標指令ベクトルr(i) (= r(i-L) )との
偏差ベクトル
【0017】
【数11】
【0018】が、 e(i) →0 (i →∞) (6) となるように、現在時刻iにおいて、制御入力ベクトル
u(i) を、1周期前の値からσ(i) だけ補正することを
考える。 u(i) = u(i-L) + σ(i) σ(i) ∈Rmx1 (7) (6) 式を実現する補正量ベクトルσ(i) は、以下の手順
で求められる。なお以下‘ベクトル’表現は省略する。
(4) 式より、
【0019】
【数12】
【0020】で定義される状態変化分η(i) と出力変化
分δ(i) の関係は次式となる。
【0021】
【数13】
【0022】また(8) 式より、e(i)=e(i-L)-δ(i) が
成り立つため、δ(i) →e(i-L) (i→∞) とすることが
できれば、(6) 式が実現される。そこで、評価関数
【0023】
【数14】
【0024】を最小とするように補正量σ(i) を決定す
る。上式を最小とするσ(i) は、重みHを、H= S- C
T QC(ただし、Sは離散形代数リカッチ方程式S= A
T SA- AT SB( R+ BT SB) - 1 T SA+ CT
QCの半正定一意解)とおくと、最適性の原理より、次
式で与えられる。
【0025】
【数15】
【0026】ここで、K、Ψk は次式
【0027】
【数16】
【0028】で与えられ、特にKは、
【0029】
【数17】
【0030】を最小にする最適フィードバックゲイン行
列となる。したがって、(7),(11)式より、(1) 式を得
る。また(7),(8),(11)式より、制御入力u(i) を(2) 式
で与えることもできる。さらに、(2) 式をz変換し、V
(z)を消去すると、
【0031】
【数18】
【0032】となるため、図3の加算器24により、w
(i)=w(i-L)+e(i) を求め、(3) 式によって制御入力u
(i) を与えることもできる。以上、(1),(2),(3) 式の導
出を行ったが、これらの式を用いた図1、2、3の実施
例以外の構成でも、適当な記憶手段と演算手段を用い
て、状態x(i) 、偏差e(i) 、制御入力u(i) のz変
換、X(z) 、E(z) 、U(z) が、(13)式となるように制
御入力u(i) を決定する手段を備えていれば、同様の効
果を持つ学習制御器が実現される。さらに、制御系の安
定性を高めるために、(13)式のz -L部分をF(z)z-Lとし
ても良い。ここでF(z) は、ローパスフィルタの伝達関
数である。また、状態x(i) の実測値が得られない場合
には、オブザーバによる推定値を用いれば良い。
【0033】
【発明の効果】以上述べたように本発明によれば、多入
力多出力の制御対象に対して、状態空間モデルを直接利
用し、演算量が少なく、さらに、最適レギュレータが持
つ最適性を有した学習制御装置が実現され、高精度な追
従動作が可能となるという効果がある。
【図面の簡単な説明】
【図1】本発明の第1の具体的実施例を示す図
【図2】本発明の第2の具体的実施例を示す図
【図3】本発明の第3の具体的実施例を示す図
【符号の説明】 1 最適予見学習制御装置 2 学習制御用定数行列を記憶するメモリ 3 偏差ベクトルを記憶するメモリ 4 状態ベクトルを記憶するメモリ 5 制御入力ベクトルを記憶するメモリ 6 演算器 7、8 減算器 11 最適予見学習制御装置 12 ベクトルvを記憶するメモリ 13 演算器 21 最適予見学習制御装置 22 ベクトルwを記憶するメモリ 23 演算器 24 加算器
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G05B 11/00 - 13/04

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】m個の入力とp個の出力を持ち、状態空間表
    現 x(i+1)=Ax(i)+Bu(i) y(i)=Cx(i) (ここで、xはn次元の状態ベクトル、uはm次元の入力ベ
    クトル、yはp次元の出力ベクトルで、A、B、Cは行列で
    ある) で表される制御対象の出力ベクトルyを、周期Lで同じパ
    ターンを繰り返す目標指令ベクトルrに追従させるよう、
    現在時刻iにおいて、目標指令ベクトルr(i)(=r(i-L))
    と、制御対象の出力ベクトルy(i)および状態ベクトルx
    (i)を入力し、制御入力ベクトルu(i)を制御対象へ出力
    する学習制御装置において、 目標指令ベクトルと出力ベクトルより、偏差ベクトルe
    (i)を求める手段と、 学習制御用定数行列を記憶する手段と、 評価関数 【数1】 (ここで、x。(i)=CT(CCT) -1r(i)-x(i)、η(i)=x(i)-x(i-
    L)、σ(i)=u(i)-u(i-L)であり、Q,R,Hは重み行列である)
    が最小となるように、現在時刻の制御入力ベクトルu(i)
    を決定する手段と、偏差ベクトルおよび制御入力ベクトルの時系列データを
    記憶する手段と、 状態ベクトルxを記憶して、その1周期前からの変化分
    ηを求める手段と、 現在時刻の制御入力ベクトルu(i)を 【数2】 (ここで、K、Ψ k は学習制御用定数行列であり、特に
    Kは制御対象に対して最適レギュレータを構成した場合
    のフィードバックゲイン行列である)として決定 する手
    段と、 を備えたことを特徴とする最適予見学習制御装置。
  2. 【請求項2】m個の入力とp個の出力を持ち、状態空間表
    x(i+1)=Ax(i)+Bu(i) y(i)=Cx(i) (ここで、xはn次元の状態ベクトル、uはm次元の入力ベ
    クトル、yはp次元の出力ベクトルで、A、B、Cは行列で
    ある)で表される制御対象の出力ベクトルyを、周期Lで
    同じパタ ンを繰り返す目標指令ベクトルrに追従させる
    よう、現在時刻iにおいて、目標指令ベクトルr(i)(=r(i
    -L))と、制御対象の出力ベクトルy(i)および状態ベクト
    ルx(i)を入力し、制御入力ベクトルu(i)を制御対象へ出
    力する学習制御装置において、 目標指令ベクトルと出力ベクトルより、偏差ベクトルe
    (i)を求める手段と、 学習制御用定数行列を記憶する手
    段と、 評価関数 【数3】 (ここで x (i)=C T (CC T ) -1 r(i)-x(i) η(i)=x(i)-x(i-
    L) σ(i)=u(i)-u(i-L)であり Q,R,Hは重み行列である)
    が最小となるように、現在時刻の制御入力ベクトルu(i)
    を決定する手段と、 偏差ベクトルおよびm次元ベクトルv(i)の時系列デ タを
    記憶する手段と、 現在時刻の制御入力ベクトルu(i)を u(i)=Kx(i)+v(i) 【数4】 (ここで、K、Ψ k は学習制御用定数行列であり、特に
    Kは制御対象に対して最適レギュレータを構成した場合
    のフィードバックゲイン行列である)として決定する手
    段と、 を備えたことを特徴とする最適予見学習制御装置
  3. 【請求項3】m個の入力とp個の出力を持ち、状態空間表
    x(i+1)=Ax(i)+Bu(i) y(i)=Cx(i) (ここで、xはn次元の状態ベクトル、uはm次元の入力ベ
    クトル、yはp次元の出力ベクトルで、A、B、Cは行列で
    ある)で表される制御対象の出力ベクトルyを、周期Lで
    同じパタ ンを繰り返す目標指令ベクトルrに追従させる
    よう、現在時刻iにおいて、目標指令ベクトルr(i)(=r(i
    -L))と、制御対象の出力ベクトルy(i)および状態ベクト
    ルx(i)を入力し、制御入力ベクトルu(i)を制御対象へ出
    力する学習制御装置において、 目標指令ベクトルと出力ベクトルより、偏差ベクトルe
    (i)を求める手段と、 学習制御用定数行列を記憶する手
    段と、 評価関数 【数5】 (ここで x (i)=C T (CC T ) -1 r(i)-x(i) η(i)=x(i)-x(i-
    L) σ(i)=u(i)-u(i-L)であり Q,R,Hは重み行列である)
    が最小となるように、現在時刻の制御入力ベクトルu(i)
    を決定する手段と、 p次元ベクトルW(i)の時系列データを記臆する手段と、 現在時刻の制御入力ベクトルu(i)を 【数19】 w(i)=w(i-L)+e(i) (ここで、K、Ψ k は学習制御用定数行列であり、特にK
    は制御対象に対して最適レギュレータを構成した場合の
    フィードバックゲイン行列である)として決定する手段
    と、 を備えたことを特徴とする最適予見学習制御装置
  4. 【請求項4】m個の入力とp個の出力を持ち、状態空間表
    x(i+1)=Ax(i)+Bu(i) y(i)=Cx(i) (ここで、xはn次元の状態ベクトル、uはm次元の入力ベ
    クトル、yはp次元の出力ベクトルで、A、B、Cは行列で
    ある)で表される制御対象の出力ベクトルyを、周期Lで
    同じパタ ンを繰り返す目標指令ベクトルrに追従させる
    よう、現在時刻iにおいて、目標指令ベクトルr(i)(=r(i
    -L))と、制御対象の出力ベクトルy(i)および状態ベクト
    ルx(i)を入力し、制御入力ベクトルu(i)を制御対象へ出
    力する学習制御装置において、 目標指令ベクトルと出力ベクトルより、偏差ベクトルe
    (i)を求める手段と、 学習制御用定数行列を記憶する手
    段と、 評価関数 【数20】 (ここで x (i)=C T (CC T ) -1 r(i)-x(i) η(i)=x(i)-x(i-
    L) σ(i)=u(i)-u(i-L)であり Q,R,Hは重み行列である)
    が最小となるように、現在時刻の制御入力ベクトルu(i)
    を決定する手段と、 適当な記憶手段と演算手段を用いて、状態ベクトルx
    (i)、偏差ベクトルe(i)、制御入力ベクトルu(i)のz変
    換、X(z)、E(z)、U(z)が、 【数21】 (ここで、F(z)はローパスフィルタの伝達関数または1
    であり、K、Ψ k は学習制御用定数行列で、特にKは制
    御対象に対して最適レギュレータを構成した場合のフィ
    ードバックゲイン行列である)となるよう制御入力ベク
    トルu(i)を決定する手段と、 を備えたことを特徴とする最適予見学習制御装置。
  5. 【請求項5】状態ベクトルx(i)をオブザーバにより推定
    する手段を備えたことを特徴とする請求項1乃至4に記
    載のいずれかの最適予見学習制御装置。
JP30754293A 1993-11-12 1993-11-12 最適予見学習制御装置 Expired - Fee Related JP3256950B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30754293A JP3256950B2 (ja) 1993-11-12 1993-11-12 最適予見学習制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30754293A JP3256950B2 (ja) 1993-11-12 1993-11-12 最適予見学習制御装置

Publications (2)

Publication Number Publication Date
JPH07141004A JPH07141004A (ja) 1995-06-02
JP3256950B2 true JP3256950B2 (ja) 2002-02-18

Family

ID=17970354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30754293A Expired - Fee Related JP3256950B2 (ja) 1993-11-12 1993-11-12 最適予見学習制御装置

Country Status (1)

Country Link
JP (1) JP3256950B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4171363B2 (ja) * 2003-07-11 2008-10-22 西部電機株式会社 工作物を任意の曲面に切削加工する高速曲面加工方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62219004A (ja) * 1986-03-19 1987-09-26 Fujitsu Ltd サ−ボ制御装置
JPS6395502A (ja) * 1986-10-11 1988-04-26 Omron Tateisi Electronics Co 離散型最適サ−ボシステム
JP3109605B2 (ja) * 1991-06-04 2000-11-20 株式会社安川電機 学習制御方法

Also Published As

Publication number Publication date
JPH07141004A (ja) 1995-06-02

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
US4663703A (en) Predictive model reference adaptive controller
JP3328742B2 (ja) ニューロpid制御装置
JPWO2006011519A1 (ja) サーボ制御装置
US4639652A (en) Control system for robot manipulator
JP3175877B2 (ja) 予見制御装置
JP3256950B2 (ja) 最適予見学習制御装置
CN111805537A (zh) 多机械手协同控制方法、系统、设备及存储介质
JP3062606B2 (ja) ニューラルネットワークを用いた適応制御装置
JPH07319558A (ja) 力制御装置における力の検出方法
JP3340923B2 (ja) Sacコントローラ
US4794313A (en) Three element digital control system
JP3191836B2 (ja) 学習制御装置
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JP3152251B2 (ja) 増分値演算による学習制御方法
JP3109605B2 (ja) 学習制御方法
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
JPH06314106A (ja) 学習制御装置
JP3039814B2 (ja) 学習制御方式
JP3039573B2 (ja) 学習制御方式
JP2003274684A (ja) サーボ制御装置
JPH01237701A (ja) 周期的目標値に最適に追従する制御方法
JPH06348305A (ja) Pid調節器のパラメータ調整装置
Isermann et al. Adaptive control systems (A short review)

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071207

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091207

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees