JPH0736505A - 制御対象の同定・制御方法 - Google Patents

制御対象の同定・制御方法

Info

Publication number
JPH0736505A
JPH0736505A JP5179568A JP17956893A JPH0736505A JP H0736505 A JPH0736505 A JP H0736505A JP 5179568 A JP5179568 A JP 5179568A JP 17956893 A JP17956893 A JP 17956893A JP H0736505 A JPH0736505 A JP H0736505A
Authority
JP
Japan
Prior art keywords
control
neural network
model
controlled object
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5179568A
Other languages
English (en)
Inventor
Isao Sekiguchi
勲 関口
Masaaki Shirai
正明 白井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Engineering Corp
Original Assignee
NKK Corp
Nippon Kokan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NKK Corp, Nippon Kokan Ltd filed Critical NKK Corp
Priority to JP5179568A priority Critical patent/JPH0736505A/ja
Publication of JPH0736505A publication Critical patent/JPH0736505A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

(57)【要約】 【目的】 制御対象が非線形の場合や、制御動作中にパ
ラメータの変動を伴う場合に、ニューラルネットワーク
を用いて、従来手法よりも短時間で且つ少い記憶領域に
よって実現可能な制御対象の同定・制御方法。 【構成】 操作量uを入力し出力量y2 を出力する制御
対象21と、前記出力量y2 と外乱wを入力し出力量y
1 を出力する制御対象11と、前記出力量y1 と目標値
1 を入力しモデル1ウェイト修正量eを出力するNN
モデル1ウェイト調整部13と、前記修正量eを入力し
前記y1 の予測値fを出力するNNモデル1と、前記出
力量y2 と目標値r2 を入力しモデル2ウェイト修正量
cを出力するNNモデル2ウェイト調整部23と、前記
修正量cと操作量uを入力し前記y2 の予測値gを出力
するNNモデル2と、前記予測値gを入力しコントロー
ラウェイト修正量hを出力するNNコントローラウェイ
ト調整部33と、前記出力量y1 ,y2 及び外乱wを入
力し、y1 ,y2 が目標値r1 ,r2 になるように制御
する操作量uを出力するNNコントローラ32とを備え
たもの。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、産業用機械、プラント
等の制御対象の動特性の同定及び制御方法に係り、特に
ニューラルネットワークを用いた改良された方法に関す
るものである。
【0002】
【従来の技術】ニューラルネットワークには、入力を非
線形変換して、その変換結果を出力する機能がある。従
ってこの機能を利用して、従来、制御対象の動特性の同
定が困難であったり、制御動作中にその動特性を表すパ
ラメータが変動するような制御対象に対して、ニューラ
ルネットワークを用いて同定する方法が知られている。
この方法は、制御対象の動特性に関する実測データを用
いてニューラルネットワークの学習を行うことにより、
ニューラルネットワークの入出力関係として制御対象の
動特性を獲得しようとするものである。このような特性
変化する非線形プラントの動特性を同定する方法が、例
えば特開平3−179502号公報に適応制御方法とし
て提案されている。(以下、「先行技術1」という)。
【0003】図9は先行技術1による非線形制御対象の
同定を行なうニューラルネットワークを示す図である。
同図は制御対象の非線形回帰モデル、即ち制御対象の入
出力変数の時系列信号に基づいて制御対象の出力変数の
推定値を求めるモデルを同定するブロック図を示し、同
図においては、入出力変数の時系列信号Zを、C=F
(Z)の関係で表わされる非線形回帰モデルに入力して
制御対象の制御量C、即ち現時点tでの出力変数y
(t)の推定値を求めている。ここでFは非線形関数で
ある。
【0004】先行技術1は、図9に示すような入出力構
造のニューラルネットワークにより、非線形なプラント
の入出力変数の時系列信号に基づいて制御対象の出力変
数の推定値を求めるモデルを、ニューラルネットワーク
の非線形学習能力を利用して同定すものである。ここで
ニューラルネットワークによる非線形モデルは次の
(1)式で表される。 yn [k+1] =f(x[k] ,u[k] ,w[k] ) …(1) ここで、yn [k+1] :1サンプル時間後の制御対象出力
量のモデルニューラルネットワークによる推定値、 x[k] :プラントの動特性を記述する状態変数ベクトル u[k] :制御変数ベクトル w[k] :外乱変数ベクトル f :動特性を表す非線形関数 である。ニューラルネットワークの入力層のユニットへ
の入力は上記x,u,wであり、出力層からの出力はy
n となる。(1)式に示す非線形関数fの特性は、ニュ
ーラルネットワークの層の数や各層のユニット数、各ユ
ニット間の重み係数、及び各ユニットに設けられた出力
関数により変化する。これらの条件を適切に設定し、制
御対象の入出力変数、すなわち(1)式におけるx,
u,w及びyを実際のプラント(冗長な同定手法にはな
るが、実際のプラント動特性が非線形である必要はな
い)の実測値を教示データとして与え、出力層における
誤差ベクトルとして、推定状態量の自乗総和誤差e[k+
1] を次の(2)式により計算する。
【0005】 e[k+1] =1/2*Σ{yn [k+1] −y[k+1] }2 …(2) ここで*は乗算記号であり、1サンプル時間後の実際の
制御対象の出力量y[k+1] と、モデルニューラルネット
ワークによるその推定量yn [k+1] との差を誤差とし
て、この誤差の2乗の総和の半分をe[k+1] として算出
する。前記(2)式のe[k+1] を求めて、これを階層型
ニューラルネットワークの学習則を用いて、その層間を
結合する重み係数調整の修正を行ない非線形動特性を同
定する。このような手法によりニューラルネットワーク
を用いる方法は、従来の線形同定の手法、例えば自己回
帰移動平均モデル(ARMAモデル)等に較べて汎化性
があり、先に示したように非線形な制御対象の動特性を
表現可能であることが知られている。ニューラルネット
ワークのこのような特徴を活かし、系の特性が変動した
り非線形性が強いロボットマニピュレータや化学プロセ
スの動特性の同定に対し応用が試みられている。
【0006】先行技術1は、ひとつのニューラルネット
ワークにより制御対象の動特性を同定するものである
が、これを複数にモジュール化し適応同定及び適応制御
系に用いる方法が、特開平4−34602号公報(以
下、「先行技術2」という)に適応制御システムとして
提案されている。図10は先行技術2による非線形制御
対象の同定・制御を行なうニューラルネットワーク構成
例を示す図である。同図は自律型潜水艇の縦運動を制御
するシステム例を示し、コントローラ及びフォワードモ
デルに、入力される状態量として、姿勢角θ、θの変化
速度、深度d、及びdの変化速度が選ばれ、また制御信
号とてエレベータ角δe が選ばれ、フォワードモデルの
出力は姿勢角θと深度dである。そして制御の目標は、
潜水艇を一定の姿勢角を保ちながら一定深度で水平航行
させることである。
【0007】先行技術1においては、制御対象の制御量
がベクトルであるようなニューラルネットワークの出力
層で構成しているのに対し、先行技術2は、図10に示
すように、制御量毎にニューラルネットワークモジュー
ルに分離する構成をとるものである。このような構成の
ねらいとして、先行技術2においては、学習の高速化
と、制御システム全体の中での各モジュールの役割の明
確化を挙げている。
【0008】図8は従来手法による制御対象同定・制御
システムの原理ブロック図であり、先行技術1のニュー
ラルネットワーク(以下NNと省略する)モデルを実際
の制御対象に適用して制御するときの手順を示してい
る。図8において、32はNNコントローラ、33はN
Nコントローラ調整部、201は制御対象、202はN
Nモデル、203はNNモデル調整部である。
【0009】図8においては、制御対象201の出力量
yと、その目標信号rとがNNウェイト調整部203に
入力され、ここで算出されたモデルウェイト修正量cが
単一ブロックよりなるNNモデル202に出力される。
NNモデル202には、前記モデルウェイト修正量cと
NNコントローラ32からの操作量uが入力され、制御
対象201の出力量yを予測し、その予測量gをNNコ
ントローラウェイト調整部33へ出力する。NNコント
ローラウェイト調整部33は前記予測量gを入力してコ
ントローラウェイト修正量hをNNコントローラ32へ
出力する。NNコントローラ32は前記コントローラウ
ェイト修正量hと、外乱信号wと、制御対象201から
の出力量yとを入力し、前記出力量yが望ましい目標値
rになるように制御する操作量uを制御対象201及び
NNモデル202へ出力する。
【0010】
【発明が解決しようとする課題】しかしながら先行技術
1のように、制御対象の入出力関係から動特性をひとつ
のモデルニューラルネットワークによって獲得する方法
では次のような問題点がある。一般的に、階層型ニュー
ラルネットワークで制御対象を同定する場合に、ニュー
ラルネットワークの特徴を活かすことのできる制御対象
としては次のものがある。(1)制御対象の動特性上の
構造(次数)は正確にわかっているがパラメータが未知
の場合、(2)制御対象の動特性上の構造(次数)は不
確かながらも概略わかっており、パラメータが未知の場
合、(3)制御対象の動特性上の構造(次数)は不確か
ながらも概略わかっており、パラメータ変動があったり
非線形性がある場合、(4)制御対象の動特性上の構造
(次数)もパラメータも未知の場合、
【0011】上記のうち(4)項については、ニューラ
ルネットワークによって動特性を同定する方法として、
先行技術1の方法が最適であり、干渉が大きく複雑な制
御対象の同定が可能になる。しかし(1)、(2)、
(3)項について、(4)項と同様に、先行技術1のよ
うな構造の入出力量をもつニューラルネットワークを用
いて動特性を同定する場合において、特に制御対象の非
干渉性が強く、他の出力変数との相関が極めて小さい入
力変数が多い系の場合は、ニューラルネットワークの冗
長性が過大となる。
【0012】いまかりに、 入力変数の数=ニューラルネットワークの入力層ユニッ
ト数=k ニューラルネットワークの隠れ層ユニット数=m 出力変数の数=ニューラルネットワークの出力層ユニッ
ト数=n とすると、全結合重み係数の数はk*m*nとなるが、
非干渉の部分で重み係数がゼロに近づく必要のある、す
なわち結合が不要なユニット同志についても重み係数の
記憶領域を確保し学習則に基づいた修正計算を反復して
行わなくてはならない。よってニューラルネットワーク
の学習に長時間を要し、また広範囲の記憶領域を必要と
するという問題がある。
【0013】さらに、この学習時間の短縮を計るため、
モデルニューラルネットワークの入出力層のユニット数
は変えずに、隠れ層のユニット数を少なくすると、計算
に必要な記憶領域は少なくなるものの、動特性を獲得し
たと判断可能なレベルにまで、ニューラルネットワーク
の制御量推定誤差が減少しないという別の問題につなが
る。また教示データに含まれるノイズが疑似効果を生ん
で、うまくモデルが収束しないことがある。このよう
に、従来一般に用いられていたニューラルネットワーク
の構成を、非線形性が強くパラメータ変動があるような
制御対象すべてに適用することには、経済上及び性能上
の問題がある。
【0014】先行技術2のように、制御対象の入出力関
係からその動特性をモジュール化した複数のモデルニュ
ーラルネットワークによって獲得しようとする方法では
次のような問題点がある。先ず、先行技術2に示される
ような、出力層ベクトルを出力変数ごとに分離して複数
のニューラルネットワークモジュールを得ることでは、
学習の高速化は実現不可能である。なぜなら、複数のネ
ットワークに分離する場合になんらかのユニット間結合
の削減を実施していないために、結果として所要計算量
は全く削減されないからである。前記のネットワーク構
成例にならうと、nネットワーク*(k*m*1)の結
合重みが存在し、この結合数は分離前となんら変化して
いない。さらに各モジュールの役割の明確化につして
も、分離する際に制御系の動特性に関わる知識にもとづ
かず、単純にニューラルネットワークの構成を表現する
便宜上の理由から出力層を分割しているために、動特性
上の特徴を明確化する効果をもたらすには至っていない
という問題があった。
【0015】本発明はかかる問題点を解決するためにな
されたもので、制御対象が非線形の場合や、制御動作中
にパラメータの変動を伴う場合に、ニューラルネットワ
ークを用いて、従来手法よりも短時間で且つ少ない記憶
領域によって実現可能な制御対象の同定・制御方法を得
ることを目的とする。
【0016】
【課題を解決するための手段】本発明の請求項1に係る
制御対象の同定・制御方法は、目標値を維持又は追従す
る制御量を出力するアクチュエータと、該アクチュエー
タの出力により制御される制御対象から構成される制御
系を対象とし、制御対象の時系列入出力信号を教示デー
タとし、過去の制御量及び操作量、または制御量、操作
量及び外乱を入力として将来の制御量を推定するよう
に、階層型ニューラルネットワークにより制御系動特性
を同定し、該同定した制御系動特性に基づき前記制御対
象の制御を行なう方法において、制御対象が内部の非干
渉性により複数の動特性に分離可能であるものについ
て、前記複数の動特性をそれぞれ対応する複数のニュー
ラルネットワークで同定する同定工程と、前記複数の各
ニューラルネットワーク間は、制御対象内部で干渉の要
因となっている物理量フローで結合する結合工程とを含
むものである。
【0017】本発明の請求項2に係る制御対象の同定・
制御方法は、前記制御対象の複数の動特性をそれぞれ同
定した複数のモデルニューラルネットワークを用いて、
制御量の誤差を干渉する物理量フローとして、前記複数
のモデルニューラルネットワーク間を伝播し、該モデル
ニューラルネットワークに直結するニューラルネットワ
ーク制御器を学習により獲得する学習・獲得工程を前記
請求項1に係る制御対象の同定・制御方法に含むように
したものである。
【0018】
【作用】本請求項1に係る発明においては、目標値を維
持又は追従する制御量を出力するアクチュエータと、該
アクチュエータの出力により制御される制御対象から構
成される制御系を対象とし、制御対象の時系列入出力信
号を教示データとし、過去の制御量及び操作量、または
制御量、操作量及び外乱を入力として将来の制御量を推
定するように、階層型ニューラルネットワークにより制
御系動特性を同定し、該同定した制御系動特性に基づき
前記制御対象の制御を行なう方法において、同定工程で
は、制御対象が内部の非干渉性により複数の動特性に分
離可能であるものについて、前記複数の動特性をそれぞ
れ対応する複数のニューラルネットワークで同定する。
結合工程では、前記複数の各ニューラルネットワーク間
は、制御対象内部で干渉の要因となっている物理量フロ
ーで結合する。
【0019】本請求項2に係る発明においては、前記請
求項1に係る発明に付加された学習・獲得工程におい
て、前記制御対象の複数の動特性をそれぞれ同定した複
数のモデルニューラルネットワークを用いて、制御量の
誤差を干渉する物理量フローとして、前記複数のモデル
ニューラルネットワーク間を伝播し、該モデルニューラ
ルネットワークに直結するニューラルネットワーク制御
器を学習により獲得する。
【0020】
【実施例】図1は本発明に係る制御対象の同定・制御方
法の原理ブロック図であり、分離構造のモデルニューラ
ルネットワークを用いた同定・制御方法を示すものであ
る。同図において11は制御対象1(例えば純粋な被制
御対象)、12はNN(ニューラルネットワーク)モデ
ル1、13はNNモデル1ウェイト調整部、21は制御
対象2(例えばアクチュエータ部)、22はNNモデル
2、23はNNモデル2ウェイト調整部、32はNNコ
ントローラ、33はNNコントローラウェイト調整部で
ある。
【0021】図1において、制御対象11及び制御対象
21は、相互の非干渉性を考慮して、分離しているとみ
なせる2つの制御対象である。この制御対象21にはN
Nコントローラ32から操作量uが入力され出力量y2
を出力する。制御対象11には、前記出力量y2 と外乱
信号wが入力され出力量y1 を出力する。NNモデル2
2には、NNコントローラ32から操作量uと、NNモ
デル2ウェイト調理部23からモデル2ウェイト修正量
cが入力され、制御対象21の出力量y2 を予測し、そ
の予測量gを出力する。同様にNNモデル12には、N
Nモデル1調整部13からモデル1ウェイト修正量eが
入力され、制御対象11の出力量y1 を予測し、その予
測量fを出力する。
【0022】NNモデル1ウェイト調整部13は、制御
対象11の出力量y1 と目標信号r1 とを入力し、モデ
ル1ウェイト修正量eをNNモデル12へ出力し、同様
にNNモデル2ウェイト調整部23は、制御対象21の
出力量y2 と目標信号r2 とを入力し、モデル2ウェイ
ト修正量cをNNモデル22へ出力する。NNコントロ
ーラウェイト調整部33には、NNモデル22から予測
量gが入力され、コントローラウェイト修正量hをNN
コントローラ32へ出力する。NNコントローラ32に
は、制御対象11及び21の出力量y1 及びy2 、コン
トローラウェイト修正量h及び外乱信号wが入力され、
前記制御対象11及び21の出力量y1 及びy2 が、望
ましい出力量の目標値r1 及びr2 になるように制御す
る操作量uを制御対象21及びNNモデル22へ出力す
る。
【0023】制御対象全体の動特性をニューラルネット
ワークによって獲得する場合に、多くのプラントにおい
ては、その制御対象が非干渉な複数の低次動特性システ
ムに分離することが可能であるという制御工学上の知識
に基づいて、その分離したグループ数に相当する数のニ
ューラルネットワークモデルで構成することができる。
図1はこのようにして、制御対象11及び21に対応し
たNNモデル12及び22を設けた例を示している。こ
の具体的な制御例として、4層構造物をアクティブ動吸
振器で制振制御する場合を例に説明する。
【0024】図2は能動型吸振器による4層構造物を制
振する場合の状態量、及び機械パラメータの説明図であ
る。同図において4層構造物は、集中質量m1 ,m2
3,m4 、水平方向の弾性係数k1 ,k2 ,k3 ,k
4 、及び減衰定数c1 ,c2,c3 ,c4 の機械パラメ
ータで非斉次の応答が表現される。そして第4層の質量
4 に外乱wが作用するときに、構造物は特にその固有
振動数においてx1 ,x2 ,x3 ,x4 なる絶対変位で
応答する。図2においては、構造物の第4層に設けら
れ、制御則に基づいて計算される操作量のサーボドライ
バの入力電圧uで駆動される能動型動吸振器の付加質量
aが、第4層との相対変位xa で制振するような慣性
力を発生し、構造物の応答を減少させる。いま、能動型
動吸振器の動特性が次の(3)式で示す2次系で同定可
能であるとする。 xa ′′′ +αxa ′′+βxa ′ γ・u …(3) ここでα,β,γは、それぞれ実験的に同定されるパラ
メータであり、′ は時間に関する1回の微分(xa
=dxa /dt)を示す。
【0025】図2の制御系に対して運動方程式を導き、
これを離散系の状態空間表現にすると、状態方程式は次
のようになる。ここでkは時間ステップを表す添字であ
る。状態ベクトルは X [k]T =[x1 ,x2 ,x3 ,x4 ,x1 ′ ,
2 ′ ,x3 ′ ,x4′ ,xa ,xa ′ ,
a ′′]T (ここでTは転置記号である) 制御入力ベクトルは UT =[u] 外乱ベクトルは WT =[w] 上記各ベクトルX,U,Wを用いた状態方程式(4)を
次に示す。 X′ =A・X+B・U+D・W …(4) (4)式における各マトリックスA,B,Dは次の
(5),(6),(7)式となる。
【0026】
【数1】
【0027】
【数2】
【0028】
【数3】
【0029】なお(5)式のAマトリックスにおける破
線でかこまた(イ)部は、4層構造物のモデル部分を示
し、破線でかこまれた(ロ)部は、(3)式で示された
能動型動吸振器のモデル部分を示している。また(4)
式中のAマトリックス要素が零及び非零である点に着目
すると、例として取り上げた能動型動吸振器を用いた制
振制御系において、構造物の動特性に作用している状態
量は、能動型動吸振器の構造物に作用する付加質量によ
る慣性力、すなわち状態量でいうと付加質量の加速度の
みであり、これが干渉項になる。この干渉している物理
量フロー、つまりアクチュエータ慣性力の構造物への作
用を除き、制御対象である構造物とアクチュエータであ
る能動型動吸振器は2つの独立した非干渉の動特性で表
現することが可能である。
【0030】ここで、干渉の源となっている物理量は必
ずしも独立な状態量である必要はなく、たとえば(3)
式の能動型動吸振器において、動特性が速度と加速度の
代わりに変位と速度で表現される2次系のような場合に
は、干渉するアクチュエータの発生する慣性力、つまり
付加質量に変位と速度の従属変数である加速度を乗じた
ものは、それら独立な状態変数で表現することが可能で
ある。ここで述べたような、非干渉と干渉に基づく物理
量フローの存在という知識を念頭に、この制御対象の動
特性を従来から採用されてきたニューラルネットワーク
で獲得することを考える。
【0031】図3は本発明における動特性獲得のための
モデルニューラルネットワークの構造を示す図である。
同図において、ニューラルネットワークAは制御対象で
ある構造物の動特性を表わし、ニューラルネットワーク
Bはアクチュエータである能動型動吸振器の動特性を表
現するものとする。状態方程式(4)のA及びDマトリ
ックスより、構造物の動特性は、自らの状態量及び外乱
力を入力としてることがわかり、構造物モデルニューラ
ルネットワークの入力層はそれらの1サンプリング時間
前の変数とすればよい。出力層ユニットからの出力によ
り次の時間ステップにおける制御量を推定するものとす
るが、ここでは制御出力ベクトルが構造物の状態ベクト
ルに等しいと考える。
【0032】同様に、(4)式のA及びBマトリックス
より、能動型動吸振器の動特性は、自らの状態量及び操
作量であるサーボドライバ入力電圧を入力としているこ
とがわかり、能動型吸振器モデルニューラルネットワー
クの入力層はそれらの1サンプリング時間前の変数とす
ればよい。出力層ユニットからの出力により次の時間ス
テップにおける制御量を推定するものとするが、ここで
は、構造物の場合と同様に制御出力ベクトルが能動型動
吸振器の状態ベクトルに等しいと考える。
【0033】この実施例においては、入力層(例えば、
図3のニューラルネットワークAの左端の縦方向白丸の
列で示す)、中間層(入力層と出力層の間の縦方向白丸
の列で示す)、及び出力層(右端の縦方向白丸の列で示
す)を持つ階層型ニューラルネットワークにより制御対
象の動特性を表現するモデルを獲得することを考えてい
る。また入力層の各ユニット(白丸で示す)が中間層の
すべてのユニットとそれぞれ直線で結合され、同様に中
間層の各ユニットが出力層のすべてのユニットとそれぞ
れ直線で結合されている状態が示されているが、これら
は前の層のユニットと後の層のユニットとがすべてウェ
イトを持って結合されていることを表わしている。
【0034】前記ユニットの出力関数は、一般に広く用
いられているf(x)=xのような線形関数、またはf
(x)=1/(1+ exp(-x))もしくはf(x)=1/
(1+tanh(x))などの非線形関数であるとし、学習
則としてはバックプロパゲーションに代表される階層型
ニューラルネットワークの学習アルゴリズムを用いるも
のとする。この階層型ニューラルネットワークの学習方
法については、既に広く知られているために、ここでの
詳しい説明は省略する。
【0035】ここで本発明における制御対象の動特性の
同定方法を従来方法と対比して説明する。図4は従来法
による制御対象のニューラルネットワークによる同定方
法を示す図でああり、同図においては、従来技術1で用
いられていたような、前述した干渉、非干渉を考慮した
動特性の分離、及びその物理量フローにもとづいた結合
に関する知識を用いない場合の、動特性を学習するニュ
ーラルネットワークの構造が示される。いま図2の構造
物の動吸振器による制振制御問題にこの方式のニューラ
ルネットワークモデルを用いる場合、入力層には1サン
プル時間前の構造物及び能動型動吸振器の状態量、構造
物への外乱及び、能動型動吸振器への操作電圧が入力さ
れ、出力層のユニットからは構造物及び能動型動吸振器
の1サンプル時間後の状態量を推定するものとする。各
層ユニットの出力関数及びニューラルネットワークの学
習アルゴリズムは前述した本発明手法の場合と同じであ
るとして、両手法による学習の相違を比較した結果を図
5に示す。
【0036】図5は本発明と従来法による制御対象の同
定・学習における誤差の収束状況を示す図であり、この
モデルニューラルネットワークの学習において、学習係
数及び慣性係数はそれぞれ0.5及び0.3とし、両手
法とも同じ係数値を用いて比較した。この比較におい
て、本発明による動特性に関する既知情報にもとづいで
分離した場合のニューラルネットワークに用いられてい
る結合ウェイト総数は、 構造物の動特性推定用ネットワーク :10×8×8×=640 能動型動吸振器の動特性推定用ネットワーク: 4×5×3= 60 計 : 700 とした。
【0037】これに対して、従来法による非分離のネッ
トワークに用いられている結合ウェイト総数は、 構造物+能動型動吸振器の動特性推定用ネッワーク:1
3×10×11=1430 とした。これは従来方法で最小繰り返し回数で学習でき
る構造のネットワークの内で最小規模のものであるため
この構造を選んだものである。図5によれば、本発明手
法による方法は従来法の1/2以下と少ない結合ウェイ
ト数を用いているにもかかわらず、推定状態の自乗総和
誤差が従来法の2/3以下のレベルに同じ学習繰り返し
数で達している。結合ウェイト数を勘案すれば実際の計
算所要時間は従来法の50パーセント程度となるため、
動特性獲得のための計算記憶領域及び学習収束計算時間
は、ともに従来手法の50パーセントほどに減少されて
いることになり、本発明手法が学習の効率化に極めて有
効であることがわかる。
【0038】図6は本発明におけるコントローラニュー
ラルネットワークの学習に関する誤差の逆伝播を説明す
る図であり、同図においては、本発明の分離方式ニュー
ラルネットワークによる制御対象動特性を同定した後
に、この学習済みモデルニューラルネットワーク及びコ
ントローラニューラルネットワークを用いて、適応制御
系を構築する際の学習手法を示している。コントローラ
ニューラルネットワークは、未学習の初期状態において
は制御器としての機能を果たさないが、そのように場合
においても系が安全であるように、その結合ウェイトを
微少なランダム値に設定しておく。
【0039】図6のコントローラニューラルネットワー
クの入力層ユニットには、構造物及び能動型動吸振器の
1ステップ前の状態量である制御対象状態量及びアクチ
ュエータ状態量と外乱が入力され、その出力層ユニット
からは能動型動吸振器のサーボドライバへの操作電圧量
が出力される。ネットワークの出力ユニットからの出力
データは実際の操作量に変換され、計算機のデジタルア
ナログ変換器に書き込まれると同時に、アクチュエータ
モデルニューラルネットワークの入力ユニットに結合さ
れている。実際の制御対象である構造物に例えば風雨や
地震等の外乱が作用する場合、構造物が応答する。この
状態量を検出し、これを減少させるような機能をコント
ローラニューラルネットワークに持たせるために、評価
関数Jを以下の(8)式で定義する。ここでは制御量が
状態量に等しいとしている。
【0040】 J=∫(Xs T s s +Xa T a a +uT Ru)dt …(8) ここで、Xs :構造物の状態量 Xa :能動型動吸振器の状態量 u: 能動型動吸振器の操作量 Qs ,Qa ,R:重みづけを行うための対角マトリック
ス であり、またXT はXの転置行列を示す。上記(8)式
のうちで、被積分関数第1項に相当する部分は、構造物
のモデルネットワーク出力ユニットより構造物制御量、
たとえば制振本来の目的により第4層応答変位、を誤差
として逆伝播する。また同第2項に相当する部分は能動
型動吸振器のモデルネットワーク出力ユニットより、能
動型動吸振器の制御量、例えば付加質量の原点保持目的
により付加質量変位、を誤差として逆伝播する。ただ
し、構造物モデルニューラルネットワーク内の誤差逆伝
播を最初に行い、能動型動吸振器の加速度の入力ユニッ
トで計算される誤差相当分を、次に計算する能動型動吸
振器の誤差逆伝播において、出力層の加速度出力ユニッ
トに送りこんで逆伝播するようにする。
【0041】これは、モデル学習の場合と同じように、
制御対象において構造物と能動型動吸振器の動特性の干
渉が能動型動吸振器加速度のみによって生じるという知
識に基づいた誤差逆伝播を行うためである。また、ここ
までの制御量の誤差逆伝播において、学習という表現を
用いていないが、これはモデルニューラルネットワーク
の動特性は既に獲得されているためにこのネットワーク
の結合ウェイトは必ずしも変更する必要はなく、誤差逆
伝播はあくまでも次項に述べるコントローラニューラル
ネットワークの学習上行う必要があることによる。この
ように、モデル内を逆伝播された制御量誤差は、コント
ローラニューラルネットワークの出力層の能動型動吸振
器の操作量出力ユニットに到達する。ここで、(8)式
における被積分関数第3項に基づいて操作量に重みを乗
じたものを、逆伝播で計算してきた誤差相当分に加算
し、操作量自体に制約を設けることが可能である。この
ようにして求めた操作量誤差相当分を出力ユニットより
逆伝播し、モデルニューラルネットワークの学習の項で
も述べたように、階層型ニューラルネットワークの学習
アルゴリズムにもとづいて、結合ウェイトを修正するこ
とでニューラルネットワークコントローラが制御器(レ
ギュレータ)として機能するように収束する。
【0042】図7は本発明の実施例である制振制御にお
けるコントローラニューラルネットワークの学習・制御
効果を示す図である。同図においては、本発明の(8)
式の評価関数の重み係数として、構造物第4層変位と、
能動型動吸振器変位の2状態量のみに重みづけを行い、
これを減じるようなレギュレータとしてニューラルネッ
トワークコントローラを学習させた場合の制振実験の結
果を示している。この実験においては、時間軸上の時刻
4secの時点でコントローラ学習を開始し、それから
6秒経過した時刻10secの時点では、図7の(b)
に示すように構造物第4層の変位は、非制御時の約20
パーセントに変位応答が抑制されている。さらに、能動
型動吸振器変位に重みづけをおこなっているために、制
振装置の付加質量がストロークリミット(図7の(a)
の変位±0.04mを越える領域にストロークリミット
は存在する)に至る以前に原点に戻ってきており変位フ
ィードバック制御の効果も得られ、安全な制御を実現し
ている。なお、この実験においては、サンプル時間20
msec内に制御対象モデルニューラルネットワークの
結合ウェイトは調整せず、コントローラニューラルネッ
トワークのみの調整を行っている。
【0043】なお、前記実施例では、実際の制御対象の
応答を誤差としてモデル内を誤差逆伝播してコントロー
ラニューラルネットワークを学習させているが、本発明
においては、学習済みモデルの制御量推定出力量を用い
てもコントローラの学習は可能である。また、前記実施
例では制御対象モデルニューラルネットワーク結合ウェ
イトを固定して、コントローラニューラルネットワーク
を学習させているが、制御対象が時々刻々変化するよう
な場合には、制御対象モデルニューラルネットワークの
結合重みを適応的に修正し、変動する制御対象に追従し
つつ、コントローラニューラルネットワークを適応的に
収束させることも、本発明により可能である。
【0044】以上の説明のように、非線形の制御対象の
動特性を同定するのが従来方法では困難な場合や、制御
動作中に動特性や制御仕様が変化する場合に、本発明を
用いて、実際の制御対象の特性をその変動中に同定し、
且つ制御対象又は同定して求められた制御対象と同等モ
デルからの応答に基づき、適応的に応答を調整する適応
制御系を構築することができる。具体的な例としては、
機械プラント、連続ミル、高層建築物の制振等のよう
に、比較的単純モデルの組合せにより非線形モデルが構
成され得る制御対象について、その動特性の同定及び制
御に本発明を適用すると有効である。
【0045】
【発明の効果】以上説明したように、従来のニューラル
ネットワークを用いた制御対象の動特性の同定、及び学
習したモデルニューラルネットワークに基づくニューラ
ルネットワーク制御系の構築方法においては、多大な収
束計算時間と記憶領域が必要であったが、本発明によれ
ば、ニューラルネットワークを用いて未知の制御対象の
動特性を同定するにあたり、制御対象の干渉あるいは非
干渉の物理的な知識を積極的に用いて一体となっている
ニューラルネットワークをサブシステムの動特性を表現
するモジュールに分離し、各モジュール間の物理的干渉
が既知である場合にはその物理量の流れを考慮した干渉
部分の結合を行い、結果として一体のニューラルネット
ワークに存在していた動特性の同定に寄与しない不要な
結合を排除し、従来の冗長なモデルニューラルネットワ
ークの構造を簡潔化するようにしたので、計算時間の短
縮と記憶領域の削減が可能になり、従来不可能であった
パーソナルコンピュータクラスの計算機によっても、効
率よく適応制御系を構築することが可能となった。
【0046】また本発明によれば、前記分離した複数の
モデルニューラルネットワークにより同定した動特性を
用いて、前記モデルニューラルネットワークに結合した
コントロールニューラルネットワークを学習させながら
獲得する場合に、前記複数のモデルニューラルネットワ
ーク間の物理的に有意の結合を通して制御量の効率的な
誤差の逆伝播を行なうようにしたので、制御動作中に動
特性や制御仕様が変化しても、制御対象又は同定して求
められた制御対象等と同等モデルからの応答に基づき、
適応的に応答を調整する適応制御系を得ることができ
る。
【図面の簡単な説明】
【図1】本発明に係る制御対象の同定・制御方法の原理
ブロック図である。
【図2】能動型動吸振器による4層構築物を制振する場
合の状態量及び機械パラメータの説明図である。
【図3】本発明における動特性獲得のためのモデルニュ
ーラルネットワークの構造を示す図である。
【図4】従来法による制御対象のニューラルネットワー
クによる同定方法を示す図である。
【図5】本発明と従来法による制御対象の同定・学習に
おける誤差の収束状況を示す図である。
【図6】本発明におけるコントローラニューラルネット
ワークの学習に関する誤差の逆伝播を示す図である。
【図7】本発明の実施例である制振制御におけるコント
ローラニューラルネットワークの学習・制御効果を示す
図である。
【図8】従来手法による制御対象同定・制御システムの
原理ブロック図である。
【図9】先行技術1による非線形制御対象の同定を行な
うニューラルネットワークを示す図である。
【図10】先行技術2による非線形制御対象の同定・制
御を行なうニューラルネットワーク構成例を示す図であ
る。
【符号の説明】
11 制御対象1 12 NNモデル1 13 NNモデル1ウェイト調整部 21 制御対象2 22 NNモデル2 23 NNモデル2ウェイト調整部 32 NNコントローラ 33 NNコントローラウェイト調整部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 目標値を維持又は追従する制御量を出力
    するアクチュエータと、該アクチュエータの出力により
    制御される制御対象から構成される制御系を対象とし、
    制御対象の時系列入出力信号を教示データとし、過去の
    制御量及び操作量、または制御量、操作量及び外乱を入
    力として将来の制御量を推定するように、階層型ニュー
    ラルネットワークにより制御系動特性を同定し、該同定
    した制御系動特性に基づき前記制御対象の制御を行なう
    方法において、 制御対象が内部の非干渉性により複数の動特性に分離可
    能であるものについて、前記複数の動特性をそれぞれ対
    応する複数のニューラルネットワークで同定する同定工
    程と、 前記複数の各ニューラルネットワーク間は、制御対象内
    部で干渉の要因となっている物理量フローで結合する結
    合工程とを含むことを特徴とする制御対象の同定・制御
    方法。
  2. 【請求項2】 前記制御対象の複数の動特性をそれぞれ
    同定した複数のモデルニューラルネットワークを用い
    て、制御量の誤差を干渉する物理量フローとして、前記
    複数のモデルニューラルネットワーク間を伝播し、該モ
    デルニューラルネットワークに直結するニューラルネッ
    トワーク制御器を学習により獲得する学習・獲得工程を
    含むことを特徴とする請求項1記載の制御対象の同定・
    制御方法。
JP5179568A 1993-07-21 1993-07-21 制御対象の同定・制御方法 Pending JPH0736505A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5179568A JPH0736505A (ja) 1993-07-21 1993-07-21 制御対象の同定・制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5179568A JPH0736505A (ja) 1993-07-21 1993-07-21 制御対象の同定・制御方法

Publications (1)

Publication Number Publication Date
JPH0736505A true JPH0736505A (ja) 1995-02-07

Family

ID=16068017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5179568A Pending JPH0736505A (ja) 1993-07-21 1993-07-21 制御対象の同定・制御方法

Country Status (1)

Country Link
JP (1) JPH0736505A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373002A (ja) * 2001-06-14 2002-12-26 Toshiba Corp プロセスシミュレータ応用制御装置及び方法
JP2019148568A (ja) * 2018-02-28 2019-09-05 株式会社Nttファシリティーズ 振動解析装置、振動解析方法及びプログラム
JP2021084188A (ja) * 2019-11-28 2021-06-03 株式会社国際電気通信基礎技術研究所 制御システム
JPWO2021106646A1 (ja) * 2019-11-29 2021-06-03
JP2021185367A (ja) * 2017-11-09 2021-12-09 株式会社Nttファシリティーズ 学習装置、モデルデータ、学習方法、制御装置、建築構造物、学習済みモデルの生成方法、及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002373002A (ja) * 2001-06-14 2002-12-26 Toshiba Corp プロセスシミュレータ応用制御装置及び方法
JP2021185367A (ja) * 2017-11-09 2021-12-09 株式会社Nttファシリティーズ 学習装置、モデルデータ、学習方法、制御装置、建築構造物、学習済みモデルの生成方法、及びプログラム
JP2019148568A (ja) * 2018-02-28 2019-09-05 株式会社Nttファシリティーズ 振動解析装置、振動解析方法及びプログラム
JP2021084188A (ja) * 2019-11-28 2021-06-03 株式会社国際電気通信基礎技術研究所 制御システム
JPWO2021106646A1 (ja) * 2019-11-29 2021-06-03
WO2021106646A1 (ja) * 2019-11-29 2021-06-03 東京エレクトロン株式会社 推論装置、推論方法及び推論プログラム

Similar Documents

Publication Publication Date Title
de Sousa et al. Adaptive control for mobile robot using wavelet networks
CN111580392B (zh) 一种串联倒立摆的有限频率范围鲁棒迭代学习控制方法
US5175678A (en) Method and procedure for neural control of dynamic processes
US5479571A (en) Neural node network and model, and method of teaching same
Behera et al. On adaptive learning rate that guarantees convergence in feedforward networks
Atkeson et al. Robot trajectory learning through practice
CN111650832B (zh) 一种水下多足步行机器人机械足姿态跟踪控制方法
Lee et al. A new scheme combining neural feedforward control with model‐predictive control
CN111273544B (zh) 基于预测rbf前馈补偿型模糊pid的雷达俯仰运动控制方法
US6768927B2 (en) Control system
JPH0736505A (ja) 制御対象の同定・制御方法
US5963710A (en) Method and apparatus for automatically generating internal representation
Ghanbari et al. Prediction of degree of crystallinity for the LTA zeolite using artificial neural networks
JP3059192B2 (ja) 適応制御システム
Alessandri et al. Optimization-based learning with bounded error for feedforward neural networks
Hovakimyan et al. A novel observer based adaptive output feedback approach for control of uncertain systems
Leeghim et al. Adaptive nonlinear control using input normalized neural networks
JPH0635510A (ja) ニューラルネットワークを用いたモデル規範型適応制御装置
Marumo et al. Intelligent modeling and control of a pneumatic motor
Farrell et al. Connectionist learning control systems: submarine depth control
CN110187637A (zh) 在控制方向和期望轨迹不确定下的机器人系统控制方法
CN115509136B (zh) 一种面向线性传感器故障无人机飞行容错控制系统及方法
JP3314239B2 (ja) Pidパラメータ・オートチューニング方法
Kuan et al. Compensation of unstructured uncertainty in manipulators using neural networks
Yan et al. Neural network-based practical fixed-time nonsingular sliding mode tracking control of autonomous surface vehicles under actuator saturation