JPH04372001A - 学習制御方法および装置 - Google Patents

学習制御方法および装置

Info

Publication number
JPH04372001A
JPH04372001A JP17723091A JP17723091A JPH04372001A JP H04372001 A JPH04372001 A JP H04372001A JP 17723091 A JP17723091 A JP 17723091A JP 17723091 A JP17723091 A JP 17723091A JP H04372001 A JPH04372001 A JP H04372001A
Authority
JP
Japan
Prior art keywords
input
output
shift register
learning control
deviation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17723091A
Other languages
English (en)
Inventor
Yuji Nakamura
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP17723091A priority Critical patent/JPH04372001A/ja
Publication of JPH04372001A publication Critical patent/JPH04372001A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、同じパターンを繰り返
す目標指令が与えられる工作機械やロボット等で使用さ
れる学習制御方法および装置に関する。
【0002】
【従来の技術】定位性を持つ制御対象を対象とした、繰
り返し目標値に対する学習制御系の設計法としては、本
出願人が特開平1−237701号公報において、提案
した方式がある。この方式の第1の発明の実施例の簡単
な構成図を図3に示す。r(i) は周期Lで同じパタ
ーンを繰り返す目標指令であり、e(i) 、u(i)
 、y(i) は、偏差、補正指令、出力である。この
方式では、繰り返し目標指令r(i) に対する偏差e
(i)が学習制御装置に入力され、学習制御装置は、未
来の偏差e(i+k) を予測して、その予測値の重み
付き2乗和J
【0003】
【数3】
【0004】が最小となるように補正指令u(i) を
1周期前の値u(i’)から補正していくというもので
、最終的には目標値と出力が一致するため、高精度な追
従動作が実現される。ここで時刻iに学習制御装置が出
力する補正指令u(i) は、次式により決定される。
【0005】
【数4】
【0006】で与えられ、Hj (j=1,2, ・・
・,N) は制御対象のステップ応答のサンプル値であ
り、Nは応答が充分に整定するように、すなわちHN 
’ =HN ( N’ >N)となるように選ばれる。 したがって、g0 =1、gN =0であることに注意
して、gn −gn−1 をあらためてgn とおけば
、学習制御装置の入力e(i) から出力u(i) ま
での伝達関数G(z) は、
【0007】
【数5】
【0008】となる。また、本出願人は、上述の設計法
における制御系のステップ応答のサンプリング点数Nを
短縮する方法として、ステップ応答を最初のN個だけサ
ンプリングして、その後はステップ応答の差分値hk 
が一定減衰比Pで減少するものと近似する方法を「近似
ステップ応答による予見学習制御方式」(平成3年6月
17日特許出願)において提案している。ここでの時刻
i における補正指令u(i) は、次式により決定さ
れる。
【0009】
【数6】
【0010】とする。したがって、この方式の場合も、
N−1 をあらためてNとおけば、学習制御装置の入力
e(i) から出力u(i) までの伝達関数G(z)
 は、
【0011】
【数7】
【0012】となる。これらの方式をモータの位置制御
系に適用すると、学習制御装置の入力は位置追従偏差で
あり、出力は補正位置指令で、学習制御装置は位置ルー
プの外側に位置することになる(図4)。そこで本出願
人は、さらに特願平2−196940号において、学習
制御装置を位置ループの内側に挿入し、その入力z(i
) を位置追従偏差あるいはその定数倍した値とし、未
来の入力(追従偏差)を予測して、Mステップ未来まで
の予測値の重み付き2乗和が最小となるように補正指令
u(i) を1周期前の値u(i’)から補正し、これ
を補正速度指令として速度制御器に入力する方式を提案
している(図5)。  ここでの学習制御装置が出力す
る補正指令u(i) は、次式により決定される。
【0013】
【数8】
【0014】で与えられ、Hj (j=1,2, ・・
・,N)は、補正指令u(i) を入力とし学習制御装
置への入力z(i) を出力とするシステムのステップ
応答のサンプル値の差分値であり、Nは応答が充分に整
定するように、すなわちHN ’ =HN (N’>N
)となるように選ばれる。したがって、この方式の場合
も、定数gn の符号を反転し、gN =0に注意すれ
ば、学習制御装置の入力z(i) から出力u(i) 
までの伝達関数G(z) は、
【0015】
【数9】
【0016】となる。
【0017】
【発明が解決しようとする課題】以上のように、上記の
3方式における学習制御装置の入出力間の伝達関数G(
z) は、定数の与え方は違うがすべて
【0018】
【数10】
【0019】となる。しかし、上式の z−L/( 1
−z−L)部分は、中立型むだ時間系となっているため
制御系全体の安定性が保証されないという問題がある(
中野他著、繰返し制御、第2章参照)。そこで本発明は
、より安定性の高い学習制御装置を提供することを目的
とする。
【0020】
【課題を解決するための手段】上記問題点を解決するた
め、本発明は、同じパターンを繰り返す目標指令に制御
対象の出力を追従させるよう、制御対象に補正指令を出
力する学習制御系において、追従偏差あるいは追従偏差
を定数倍したものを入力とし、その入力信号に下記伝達
関数G(z) を乗じたものを補正指令として出力する
ことを特徴とするものである。
【0021】
【数11】
【0022】ここで、Q、gn 、qm は、現在時刻
よりMステップ未来時刻までの偏差の予測値の重み付き
2乗和が、最小となるよう定められる定数であり、F(
z) はローパスフィルタの伝達関数である。
【0023】
【作用】制御対象の伝達関数をGp(z)とすると、上
記手段により、
【0024】
【数12】
【0025】なる関係が成り立ち、これを変形すると、
  E(z) =  z−LF(z)(1−G1(z)
 )E(z) +G2(z)(1−F(z)z−L)R
(z) となる。ただし、 G1(z) =  G2(z)  Gp(z)  D(
z) −1  C(z)G2(z) =(1+QGp(
z)D(z) −1) −1
【0026】
【数13】
【0027】とする。ここで、制御系の安定条件は、|
F(jω) ||1−G1(jω) |<1すなわち、
G1(jω) のベクトル軌跡が中心(1,0) 半径
1/|F(jω) |の円内にあることである。したが
って、F(z) にローパスフィルタの特性を持たせ、
追従させたい周波数域ではF(jω) ≒1とし、|1
−G1(jω) |が1以上となる高周波数域では|F
(jω) |<1とすることにより、安定性が保証され
る。
【0028】
【実施例】以下、本発明を実施例に基づいて具体的に説
明する。図1は、本発明の学習制御装置の第1の内部構
成例である。同図において、1、4、9は、加算器、2
、6、10は、サンプリング周期に同期してデータをシ
フトする、第1、第2、第3のシフトレジスタであり、
それぞれの段数は、2p段、L−p段、N段である。た
だし、Lは、繰り返し動作の1周期分に相当する段数で
ある。3、7、8、11は、それぞれ2p+1個、M個
、1個、N個の、乗算器、5は、第1のシフトレジスタ
2と2p+1個の乗算器3と、第2の加算器4からなる
2p+1次のローパスフィルタである。以下、同図の学
習制御装置の入力である追従偏差e(i) から、出力
である補正指令u(i) までのデータの流れを追うこ
とにより、本装置の機能を説明する。
【0029】まず、入力された追従偏差e(i) は、
第1の加算器1により、第2のシフトレジスタ6の最終
段の出力と加算されるとともに、第3の乗算器8に入力
される。第1の加算器1の出力は、フィルタ5に入力さ
れ、フィルタ内の第1のシフトレジスタ2において、サ
ンプリング周期に同期してシフトされる。この2p段の
シフトレジスタ2の初段の入力データ、および各段の出
力データは、乗算器3により乗数倍された後、第2の加
算器4に入力され、当加算器4の出力がフィルタ5の出
力となる。
【0030】フィルタ5の出力は、第2のシフトレジス
タ6に入力され、サンプリング周期でシフトされる。こ
のシフトレジスタ6の最終段より1段前からM段前の出
力は、それぞれM個の乗算器7によって乗数倍され、前
記第3の乗算器8の出力とともに、第3の加算器9に入
力される。さらに、第3のシフトレジスタ10の各段の
出力も、それぞれ、第4の乗算器11により、乗数倍さ
れ、符号を反転されて、この第3の加算器9に入力され
る。第3の加算器9の出力は、本学習制御装置の出力と
して出力されるとともに、第3のシフトレジスタ10に
入力され、サンプリング周期でシフトされていく。以上
のデータ処理により、入力e(i) から出力u(i)
 までの伝達関数G(z) は、
【0031】
【数14】
【0032】となる。ただし、F(z) はローパスフ
ィルタ5からその遅れ時間pを除いたものの伝達関数で
あり、フィルタの係数 a0,a1, …,ap は、
伝達関数F(z) が、追従させたい周波数域ではF(
jω) ≒1となり、それ以上の高周波数域では|F(
jω) |≪1となるよう設定する。定数Q、gn 、
qm は、乗算器8、11、7の乗数で、現在時刻iよ
りMステップ未来時刻までの偏差の予測値{e(i+1
),e(i+2),…, e(i+M) }の重み付き
2乗和が、最小となるよう以下のように定められる。例
えば、学習方式として、特開平1ー237701号公報
の第1の発明の方式を利用する場合には、各定数は、

0033】
【数15】
【0034】で与えられる。ただし、Hj (j=1,
2, ・・・,N) は制御対象のステップ応答のサン
プル値であり、Nは応答が充分に整定するように、すな
わちHN ’ =HN (N’ >N)となるように選
ばれる。さらに、hj = Hj −Hj−1 である
。また、「近似ステップ応答による予見学習制御方式」
(平成3年6月17日特許出願)の方式を利用する場合
には、各定数は、
【0035】
【数16】
【0036】で与えられる。さらに、特願平2−196
940号の方式を利用する場合には、各定数は、
【00
37】
【数17】
【0038】で与えられ、Hj (j=1,2, ・・
・,N)は、補正指令u(i) を入力とし学習制御装
置への入力e(i) を出力とするシステムのステップ
応答のサンプル値の差分値であり、Nは応答が充分に整
定するように、すなわちHN ’ =HN (N’>N
)となるように選ばれる。また、この場合の入力e(i
) は、偏差を乗数倍した(特願平2−196940号
ではz(i) と表記)ものである。
【0039】次に本発明の学習制御装置の第2の内部構
成例を図2に示す。同図において、21は、加算部、2
3、26は、積和演算部であり、これらの演算はCPU
によって、サンプリング周期で行われる。24は、第1
の内部構成図のローパスフィルタ5に相当する。22は
、現在時刻iから2pサンプリング過去までのデータβ
(j) j=i,i−1,…i−2pを記憶する第1の
リングメモリ、25は、1周期分のデータα(j) j
=0,1,…,L−1を記憶する第2のリングメモリ、
27は、現在時刻iからNサンプリング過去までのデー
タu(j) j=i,i−1,…,i−Nを記憶する第
3のリングメモリである。
【0040】以下、同図の学習制御装置の入力である追
従偏差e(i) から、出力である補正指令u(i) 
までのデータの流れを追うことにより、本装置の機能を
説明する。まず、時刻iにおいて入力された追従偏差e
(i)と、第2のリングメモリ25の時刻iに対応する
番地のデータα(i) とを加算した値β(i) を、
第1のリングメモリ22の時刻iに対応する番地に格納
する(β(i) = e(i)+α(i) )。つぎに
【0041】
【数18】
【0042】なる積和演算23によって得られたα(i
−p) を第2のリングメモリ25に格納する。さらに
【0043】
【数19】
【0044】なる演算26により補正指令u(i) を
決定し出力するとともに、この値を第3のリングメモリ
27に格納する。以上のデータ処理により、入力e(i
) から出力u(i) までの伝達関数G(z) は、
【0045】
【数20】
【0046】となる。ただし、ローパスフィルタ24か
らその遅れ時間pを除いたものの伝達関数F(z) お
よび、定数Q、gn 、qm は、図1の場合と同様に
設定される。なお第1、第2の内部構成例において、十
分な試行を経て、入力である偏差eがあらかじめ設定さ
れた値以内に収束した後は、入力e(i) の加算器1
、21への入力をやめ、a0 = 1 , aj = 
0(j≠0)としてフィルタ機能をころすことによって
、補正機能を削除しても良い。
【0047】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標指令に対する動作を繰り返す学習制御
系において、未来の追従偏差予測値の重み付き2乗和が
、最小となるように補正指令を決定しており、さらに、
安定化のためにローパスフィルタを利用しているため、
より安定した高精度な追従動作が可能な学習制御装置が
実現される。
【図面の簡単な説明】
【図1】本発明の実施例
【図2】本発明の他の実施例
【図3】従来例
【図4】従来例
【図5】従来例
【符号の説明】
1、4、9  加算器 2  第1のシフトレジスタ 3  2p+1個の乗算器 5  ローパスフィルタ 6  第2のシフトレジスタ 7  M個の乗算器 8  乗算器 10  第3のシフトレジスタ 11  N個の乗算器、 21  加算部 22  第1のリングメモリ 23、26  積和演算部 24  ローパスフィルタ 25  第2のリングメモリ 27  第3のリングメモリ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】  同じパターンを繰り返す目標指令に制
    御対象の出力を追従させるよう、制御対象に補正指令を
    出力する学習制御系において、追従偏差あるいは追従偏
    差を定数倍したものを入力とし、その入力信号に下記伝
    達関数G(z) を乗じたものを補正指令として出力す
    ることを特徴とする学習制御方法。 【数1】 (ここで、Lは、目標指令1周期分のサンプリング数で
    あり、Q、gn 、qm は、現在時刻よりMステップ
    未来時刻までの偏差の予測値の重み付き2乗和が、最小
    となるよう定められる定数であり、F(z) はローパ
    スフィルタの伝達関数である)
  2. 【請求項2】  同じパターンを繰り返す目標指令に制
    御対象の出力を追従させるよう、制御対象に補正指令を
    出力する学習制御装置において、2p段の第1のシフト
    レジスタを持つローパスフィルタと、L−p段の第2の
    シフトレジスタと、N段の第3のシフトレジスタとを備
    え、前記各シフトレジスタはサンプリング周期に同期し
    てデータをシフトするものとし、時刻iに入力された追
    従偏差e(i) と、前記第2のシフトレジスタの最終
    段の出力とを加算したものを、前記ローパスフィルタに
    入力し、その前記ローパスフィルタの出力を前記第2の
    シフトレジスタの初段に入力し、追従偏差e(i) を
    乗数倍したものと、前記第2のシフトレジスタの最終段
    より1段前からM段前までの各出力をそれぞれ乗数倍し
    たものと、前記第3のシフトレジスタの各段の出力をそ
    れぞれ乗数倍して符号を反転したものとを加算して前記
    第3のシフトレジスタに入力するとともに、補正指令u
    (i) として出力するようにしたことを特徴とする学
    習制御装置。
  3. 【請求項3】  十分な試行を経て、入力である偏差e
    があらかじめ設定された値以内に収束した後は、入力e
    (i) と第2のシフトレジスタの最終段の出力との加
    算をやめ、第2のシフトレジスタの最終段の出力のみを
    第1のシフトレジスタに入力し、当シフトレジスタのp
    段目の出力のみを第2のシフトレジスタに入力すること
    を特徴とする請求項2記載の学習制御装置。
  4. 【請求項4】    同じパターンを繰り返す目標指令
    に制御対象の出力を追従させるよう、制御対象に補正指
    令を出力する学習制御装置において、現在時刻iからi
    −2pサンプリング過去までのデータβ(j) j=i
    ,i−1,…i−2pを記憶する第1のリングメモリを
    持つローパスフィルタと、1周期分のデータα(j) 
    j=0,1,…,L−1を記憶する第2のリングメモリ
    と、現在時刻iからNサンプリング過去までのデータu
    (j) j=i,i−1,…,i−Nを記憶する第3の
    リングメモリとを備え、各サンプリング時刻iにおいて
    、入力された追従偏差e(i) と、前記第2のリング
    メモリの時刻iに対応する番地のデータα(i) とを
    加算した値β(i)を、前記ローパスフィルタに入力し
    、その前記ローパスフィルタの出力α(i−p) を前
    記第2のリングメモリの時刻i−pに対応する番地に格
    納し、さらに、【数2】 なる演算により補正指令u(i) を決定し出力すると
    ともに、この値を前記第3のリングメモリに格納するこ
    とを特徴とする学習制御装置。
  5. 【請求項5】  十分な試行を経て、入力である偏差e
    があらかじめ設定された値以内に収束した後は、入力e
    (i) と第2のリングメモリのデータα(i) との
    加算をやめ、α(i) のみを第1のリングメモリの時
    刻iに対応する番地に格納し、当リングメモリの時刻i
    −pに対応する番地のデータのみを第2のリングメモリ
    の時刻i−pに対応する番地に格納することを特徴とす
    る請求項4記載の学習制御装置。
JP17723091A 1991-06-20 1991-06-20 学習制御方法および装置 Pending JPH04372001A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17723091A JPH04372001A (ja) 1991-06-20 1991-06-20 学習制御方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17723091A JPH04372001A (ja) 1991-06-20 1991-06-20 学習制御方法および装置

Publications (1)

Publication Number Publication Date
JPH04372001A true JPH04372001A (ja) 1992-12-25

Family

ID=16027431

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17723091A Pending JPH04372001A (ja) 1991-06-20 1991-06-20 学習制御方法および装置

Country Status (1)

Country Link
JP (1) JPH04372001A (ja)

Similar Documents

Publication Publication Date Title
US5424942A (en) Extended horizon adaptive block predictive controller with an efficient prediction system
Franklin et al. Feedback control of dynamic systems
Polycarpou Stable adaptive neural control scheme for nonlinear systems
US5404253A (en) Estimator-based runout compensation in a disk drive
JP2007293883A (ja) 効率的かつ正確なフィルタリングおよび補間のための方法およびシステム
JP2002062906A (ja) 予測制御装置
JPH0445859B2 (ja)
EP0722587A1 (en) Learning neural network and methods thereof
JPS59142603A (ja) 高ゲインフイ−ドバツク制御系
US4970638A (en) Control of unknown systems via deconvolution
US6081820A (en) Method and apparatus for filtering a signal using a window value
WO1993020489A1 (en) Prediction control apparatus
JPH04372001A (ja) 学習制御方法および装置
EP0483364A1 (en) Discrete type repetition control method and apparatus therefor
Dubay et al. Well-conditioned model predictive control
O’Brien Jr et al. Robust controller design for linear, time-varying systems
JPH0335353A (ja) 離散的コサイン変換装置
JPH1091604A (ja) 関数学習装置
US4949237A (en) Digital integrating module for sampling control devices
Wu Simulation study and instability of adaptive control
JPH04369002A (ja) 近似ステップ応答による予見学習制御方式
JPH05265510A (ja) 学習制御装置
JPH03225420A (ja) ベッセル関数近似多項式係数の計算方式
JP2584516B2 (ja) 開立計算装置
JP3453321B2 (ja) 演算処理方法及び演算処理回路