JPH0736505A

JPH0736505A - 制御対象の同定・制御方法

Info

Publication number: JPH0736505A
Application number: JP5179568A
Authority: JP
Inventors: Isao Sekiguchi; 勲関口; Masaaki Shirai; 正明白井
Original assignee: NKK Corp; Nippon Kokan Ltd
Current assignee: JFE Engineering Corp
Priority date: 1993-07-21
Filing date: 1993-07-21
Publication date: 1995-02-07

Abstract

(57)【要約】【目的】制御対象が非線形の場合や、制御動作中にパ
ラメータの変動を伴う場合に、ニューラルネットワーク
を用いて、従来手法よりも短時間で且つ少い記憶領域に
よって実現可能な制御対象の同定・制御方法。【構成】操作量ｕを入力し出力量ｙ₂を出力する制御
対象２１と、前記出力量ｙ₂と外乱ｗを入力し出力量ｙ
₁を出力する制御対象１１と、前記出力量ｙ₁と目標値
ｒ₁を入力しモデル１ウェイト修正量ｅを出力するＮＮ
モデル１ウェイト調整部１３と、前記修正量ｅを入力し
前記ｙ₁の予測値ｆを出力するＮＮモデル１と、前記出
力量ｙ₂と目標値ｒ₂を入力しモデル２ウェイト修正量
ｃを出力するＮＮモデル２ウェイト調整部２３と、前記
修正量ｃと操作量ｕを入力し前記ｙ₂の予測値ｇを出力
するＮＮモデル２と、前記予測値ｇを入力しコントロー
ラウェイト修正量ｈを出力するＮＮコントローラウェイ
ト調整部３３と、前記出力量ｙ₁，ｙ₂及び外乱ｗを入
力し、ｙ₁，ｙ₂が目標値ｒ₁，ｒ₂になるように制御
する操作量ｕを出力するＮＮコントローラ３２とを備え
たもの。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、産業用機械、プラント
等の制御対象の動特性の同定及び制御方法に係り、特に
ニューラルネットワークを用いた改良された方法に関す
るものである。

【０００２】

【従来の技術】ニューラルネットワークには、入力を非
線形変換して、その変換結果を出力する機能がある。従
ってこの機能を利用して、従来、制御対象の動特性の同
定が困難であったり、制御動作中にその動特性を表すパ
ラメータが変動するような制御対象に対して、ニューラ
ルネットワークを用いて同定する方法が知られている。
この方法は、制御対象の動特性に関する実測データを用
いてニューラルネットワークの学習を行うことにより、
ニューラルネットワークの入出力関係として制御対象の
動特性を獲得しようとするものである。このような特性
変化する非線形プラントの動特性を同定する方法が、例
えば特開平３−１７９５０２号公報に適応制御方法とし
て提案されている。（以下、「先行技術１」という）。

【０００３】図９は先行技術１による非線形制御対象の
同定を行なうニューラルネットワークを示す図である。
同図は制御対象の非線形回帰モデル、即ち制御対象の入
出力変数の時系列信号に基づいて制御対象の出力変数の
推定値を求めるモデルを同定するブロック図を示し、同
図においては、入出力変数の時系列信号Ｚを、Ｃ＝Ｆ
（Ｚ）の関係で表わされる非線形回帰モデルに入力して
制御対象の制御量Ｃ、即ち現時点ｔでの出力変数ｙ
（ｔ）の推定値を求めている。ここでＦは非線形関数で
ある。

【０００４】先行技術１は、図９に示すような入出力構
造のニューラルネットワークにより、非線形なプラント
の入出力変数の時系列信号に基づいて制御対象の出力変
数の推定値を求めるモデルを、ニューラルネットワーク
の非線形学習能力を利用して同定すものである。ここで
ニューラルネットワークによる非線形モデルは次の
（１）式で表される。ｙ_n[k+1] ＝ｆ（ｘ[k] ，ｕ[k] ，ｗ[k] ） …（１）ここで、ｙ_n[k+1] ：１サンプル時間後の制御対象出力
量のモデルニューラルネットワークによる推定値、ｘ[k] ：プラントの動特性を記述する状態変数ベクトルｕ[k] ：制御変数ベクトルｗ[k] ：外乱変数ベクトルｆ：動特性を表す非線形関数である。ニューラルネットワークの入力層のユニットへ
の入力は上記ｘ，ｕ，ｗであり、出力層からの出力はｙ
_nとなる。（１）式に示す非線形関数ｆの特性は、ニュ
ーラルネットワークの層の数や各層のユニット数、各ユ
ニット間の重み係数、及び各ユニットに設けられた出力
関数により変化する。これらの条件を適切に設定し、制
御対象の入出力変数、すなわち（１）式におけるｘ，
ｕ，ｗ及びｙを実際のプラント（冗長な同定手法にはな
るが、実際のプラント動特性が非線形である必要はな
い）の実測値を教示データとして与え、出力層における
誤差ベクトルとして、推定状態量の自乗総和誤差ｅ[k+
1] を次の（２）式により計算する。

【０００５】ｅ[k+1] ＝1/2*Σ｛ｙ_n[k+1] −ｙ[k+1] ｝² …（２）ここで＊は乗算記号であり、１サンプル時間後の実際の
制御対象の出力量ｙ[k+1] と、モデルニューラルネット
ワークによるその推定量ｙ_n[k+1] との差を誤差とし
て、この誤差の２乗の総和の半分をｅ[k+1] として算出
する。前記（２）式のｅ[k+1] を求めて、これを階層型
ニューラルネットワークの学習則を用いて、その層間を
結合する重み係数調整の修正を行ない非線形動特性を同
定する。このような手法によりニューラルネットワーク
を用いる方法は、従来の線形同定の手法、例えば自己回
帰移動平均モデル（ＡＲＭＡモデル）等に較べて汎化性
があり、先に示したように非線形な制御対象の動特性を
表現可能であることが知られている。ニューラルネット
ワークのこのような特徴を活かし、系の特性が変動した
り非線形性が強いロボットマニピュレータや化学プロセ
スの動特性の同定に対し応用が試みられている。

【０００６】先行技術１は、ひとつのニューラルネット
ワークにより制御対象の動特性を同定するものである
が、これを複数にモジュール化し適応同定及び適応制御
系に用いる方法が、特開平４−３４６０２号公報（以
下、「先行技術２」という）に適応制御システムとして
提案されている。図１０は先行技術２による非線形制御
対象の同定・制御を行なうニューラルネットワーク構成
例を示す図である。同図は自律型潜水艇の縦運動を制御
するシステム例を示し、コントローラ及びフォワードモ
デルに、入力される状態量として、姿勢角θ、θの変化
速度、深度ｄ、及びｄの変化速度が選ばれ、また制御信
号とてエレベータ角δ_eが選ばれ、フォワードモデルの
出力は姿勢角θと深度ｄである。そして制御の目標は、
潜水艇を一定の姿勢角を保ちながら一定深度で水平航行
させることである。

【０００７】先行技術１においては、制御対象の制御量
がベクトルであるようなニューラルネットワークの出力
層で構成しているのに対し、先行技術２は、図１０に示
すように、制御量毎にニューラルネットワークモジュー
ルに分離する構成をとるものである。このような構成の
ねらいとして、先行技術２においては、学習の高速化
と、制御システム全体の中での各モジュールの役割の明
確化を挙げている。

【０００８】図８は従来手法による制御対象同定・制御
システムの原理ブロック図であり、先行技術１のニュー
ラルネットワーク（以下ＮＮと省略する）モデルを実際
の制御対象に適用して制御するときの手順を示してい
る。図８において、３２はＮＮコントローラ、３３はＮ
Ｎコントローラ調整部、２０１は制御対象、２０２はＮ
Ｎモデル、２０３はＮＮモデル調整部である。

【０００９】図８においては、制御対象２０１の出力量
ｙと、その目標信号ｒとがＮＮウェイト調整部２０３に
入力され、ここで算出されたモデルウェイト修正量ｃが
単一ブロックよりなるＮＮモデル２０２に出力される。
ＮＮモデル２０２には、前記モデルウェイト修正量ｃと
ＮＮコントローラ３２からの操作量ｕが入力され、制御
対象２０１の出力量ｙを予測し、その予測量ｇをＮＮコ
ントローラウェイト調整部３３へ出力する。ＮＮコント
ローラウェイト調整部３３は前記予測量ｇを入力してコ
ントローラウェイト修正量ｈをＮＮコントローラ３２へ
出力する。ＮＮコントローラ３２は前記コントローラウ
ェイト修正量ｈと、外乱信号ｗと、制御対象２０１から
の出力量ｙとを入力し、前記出力量ｙが望ましい目標値
ｒになるように制御する操作量ｕを制御対象２０１及び
ＮＮモデル２０２へ出力する。

【００１０】

【発明が解決しようとする課題】しかしながら先行技術
１のように、制御対象の入出力関係から動特性をひとつ
のモデルニューラルネットワークによって獲得する方法
では次のような問題点がある。一般的に、階層型ニュー
ラルネットワークで制御対象を同定する場合に、ニュー
ラルネットワークの特徴を活かすことのできる制御対象
としては次のものがある。（１）制御対象の動特性上の
構造（次数）は正確にわかっているがパラメータが未知
の場合、（２）制御対象の動特性上の構造（次数）は不
確かながらも概略わかっており、パラメータが未知の場
合、（３）制御対象の動特性上の構造（次数）は不確か
ながらも概略わかっており、パラメータ変動があったり
非線形性がある場合、（４）制御対象の動特性上の構造
（次数）もパラメータも未知の場合、

【００１１】上記のうち（４）項については、ニューラ
ルネットワークによって動特性を同定する方法として、
先行技術１の方法が最適であり、干渉が大きく複雑な制
御対象の同定が可能になる。しかし（１）、（２）、
（３）項について、（４）項と同様に、先行技術１のよ
うな構造の入出力量をもつニューラルネットワークを用
いて動特性を同定する場合において、特に制御対象の非
干渉性が強く、他の出力変数との相関が極めて小さい入
力変数が多い系の場合は、ニューラルネットワークの冗
長性が過大となる。

【００１２】いまかりに、入力変数の数＝ニューラルネットワークの入力層ユニッ
ト数＝ｋニューラルネットワークの隠れ層ユニット数＝ｍ出力変数の数＝ニューラルネットワークの出力層ユニッ
ト数＝ｎとすると、全結合重み係数の数はｋ＊ｍ＊ｎとなるが、
非干渉の部分で重み係数がゼロに近づく必要のある、す
なわち結合が不要なユニット同志についても重み係数の
記憶領域を確保し学習則に基づいた修正計算を反復して
行わなくてはならない。よってニューラルネットワーク
の学習に長時間を要し、また広範囲の記憶領域を必要と
するという問題がある。

【００１３】さらに、この学習時間の短縮を計るため、
モデルニューラルネットワークの入出力層のユニット数
は変えずに、隠れ層のユニット数を少なくすると、計算
に必要な記憶領域は少なくなるものの、動特性を獲得し
たと判断可能なレベルにまで、ニューラルネットワーク
の制御量推定誤差が減少しないという別の問題につなが
る。また教示データに含まれるノイズが疑似効果を生ん
で、うまくモデルが収束しないことがある。このよう
に、従来一般に用いられていたニューラルネットワーク
の構成を、非線形性が強くパラメータ変動があるような
制御対象すべてに適用することには、経済上及び性能上
の問題がある。

【００１４】先行技術２のように、制御対象の入出力関
係からその動特性をモジュール化した複数のモデルニュ
ーラルネットワークによって獲得しようとする方法では
次のような問題点がある。先ず、先行技術２に示される
ような、出力層ベクトルを出力変数ごとに分離して複数
のニューラルネットワークモジュールを得ることでは、
学習の高速化は実現不可能である。なぜなら、複数のネ
ットワークに分離する場合になんらかのユニット間結合
の削減を実施していないために、結果として所要計算量
は全く削減されないからである。前記のネットワーク構
成例にならうと、ｎネットワーク＊（ｋ＊ｍ＊１）の結
合重みが存在し、この結合数は分離前となんら変化して
いない。さらに各モジュールの役割の明確化につして
も、分離する際に制御系の動特性に関わる知識にもとづ
かず、単純にニューラルネットワークの構成を表現する
便宜上の理由から出力層を分割しているために、動特性
上の特徴を明確化する効果をもたらすには至っていない
という問題があった。

【００１５】本発明はかかる問題点を解決するためにな
されたもので、制御対象が非線形の場合や、制御動作中
にパラメータの変動を伴う場合に、ニューラルネットワ
ークを用いて、従来手法よりも短時間で且つ少ない記憶
領域によって実現可能な制御対象の同定・制御方法を得
ることを目的とする。

【００１６】

【課題を解決するための手段】本発明の請求項１に係る
制御対象の同定・制御方法は、目標値を維持又は追従す
る制御量を出力するアクチュエータと、該アクチュエー
タの出力により制御される制御対象から構成される制御
系を対象とし、制御対象の時系列入出力信号を教示デー
タとし、過去の制御量及び操作量、または制御量、操作
量及び外乱を入力として将来の制御量を推定するよう
に、階層型ニューラルネットワークにより制御系動特性
を同定し、該同定した制御系動特性に基づき前記制御対
象の制御を行なう方法において、制御対象が内部の非干
渉性により複数の動特性に分離可能であるものについ
て、前記複数の動特性をそれぞれ対応する複数のニュー
ラルネットワークで同定する同定工程と、前記複数の各
ニューラルネットワーク間は、制御対象内部で干渉の要
因となっている物理量フローで結合する結合工程とを含
むものである。

【００１７】本発明の請求項２に係る制御対象の同定・
制御方法は、前記制御対象の複数の動特性をそれぞれ同
定した複数のモデルニューラルネットワークを用いて、
制御量の誤差を干渉する物理量フローとして、前記複数
のモデルニューラルネットワーク間を伝播し、該モデル
ニューラルネットワークに直結するニューラルネットワ
ーク制御器を学習により獲得する学習・獲得工程を前記
請求項１に係る制御対象の同定・制御方法に含むように
したものである。

【００１８】

【作用】本請求項１に係る発明においては、目標値を維
持又は追従する制御量を出力するアクチュエータと、該
アクチュエータの出力により制御される制御対象から構
成される制御系を対象とし、制御対象の時系列入出力信
号を教示データとし、過去の制御量及び操作量、または
制御量、操作量及び外乱を入力として将来の制御量を推
定するように、階層型ニューラルネットワークにより制
御系動特性を同定し、該同定した制御系動特性に基づき
前記制御対象の制御を行なう方法において、同定工程で
は、制御対象が内部の非干渉性により複数の動特性に分
離可能であるものについて、前記複数の動特性をそれぞ
れ対応する複数のニューラルネットワークで同定する。
結合工程では、前記複数の各ニューラルネットワーク間
は、制御対象内部で干渉の要因となっている物理量フロ
ーで結合する。

【００１９】本請求項２に係る発明においては、前記請
求項１に係る発明に付加された学習・獲得工程におい
て、前記制御対象の複数の動特性をそれぞれ同定した複
数のモデルニューラルネットワークを用いて、制御量の
誤差を干渉する物理量フローとして、前記複数のモデル
ニューラルネットワーク間を伝播し、該モデルニューラ
ルネットワークに直結するニューラルネットワーク制御
器を学習により獲得する。

【００２０】

【実施例】図１は本発明に係る制御対象の同定・制御方
法の原理ブロック図であり、分離構造のモデルニューラ
ルネットワークを用いた同定・制御方法を示すものであ
る。同図において１１は制御対象１（例えば純粋な被制
御対象）、１２はＮＮ（ニューラルネットワーク）モデ
ル１、１３はＮＮモデル１ウェイト調整部、２１は制御
対象２（例えばアクチュエータ部）、２２はＮＮモデル
２、２３はＮＮモデル２ウェイト調整部、３２はＮＮコ
ントローラ、３３はＮＮコントローラウェイト調整部で
ある。

【００２１】図１において、制御対象１１及び制御対象
２１は、相互の非干渉性を考慮して、分離しているとみ
なせる２つの制御対象である。この制御対象２１にはＮ
Ｎコントローラ３２から操作量ｕが入力され出力量ｙ₂
を出力する。制御対象１１には、前記出力量ｙ₂と外乱
信号ｗが入力され出力量ｙ₁を出力する。ＮＮモデル２
２には、ＮＮコントローラ３２から操作量ｕと、ＮＮモ
デル２ウェイト調理部２３からモデル２ウェイト修正量
ｃが入力され、制御対象２１の出力量ｙ₂を予測し、そ
の予測量ｇを出力する。同様にＮＮモデル１２には、Ｎ
Ｎモデル１調整部１３からモデル１ウェイト修正量ｅが
入力され、制御対象１１の出力量ｙ₁を予測し、その予
測量ｆを出力する。

【００２２】ＮＮモデル１ウェイト調整部１３は、制御
対象１１の出力量ｙ₁と目標信号ｒ₁とを入力し、モデ
ル１ウェイト修正量ｅをＮＮモデル１２へ出力し、同様
にＮＮモデル２ウェイト調整部２３は、制御対象２１の
出力量ｙ₂と目標信号ｒ₂とを入力し、モデル２ウェイ
ト修正量ｃをＮＮモデル２２へ出力する。ＮＮコントロ
ーラウェイト調整部３３には、ＮＮモデル２２から予測
量ｇが入力され、コントローラウェイト修正量ｈをＮＮ
コントローラ３２へ出力する。ＮＮコントローラ３２に
は、制御対象１１及び２１の出力量ｙ₁及びｙ₂、コン
トローラウェイト修正量ｈ及び外乱信号ｗが入力され、
前記制御対象１１及び２１の出力量ｙ₁及びｙ₂が、望
ましい出力量の目標値ｒ₁及びｒ₂になるように制御す
る操作量ｕを制御対象２１及びＮＮモデル２２へ出力す
る。

【００２３】制御対象全体の動特性をニューラルネット
ワークによって獲得する場合に、多くのプラントにおい
ては、その制御対象が非干渉な複数の低次動特性システ
ムに分離することが可能であるという制御工学上の知識
に基づいて、その分離したグループ数に相当する数のニ
ューラルネットワークモデルで構成することができる。
図１はこのようにして、制御対象１１及び２１に対応し
たＮＮモデル１２及び２２を設けた例を示している。こ
の具体的な制御例として、４層構造物をアクティブ動吸
振器で制振制御する場合を例に説明する。

【００２４】図２は能動型吸振器による４層構造物を制
振する場合の状態量、及び機械パラメータの説明図であ
る。同図において４層構造物は、集中質量ｍ₁，ｍ₂，
ｍ₃，ｍ₄、水平方向の弾性係数ｋ₁，ｋ₂，ｋ₃，ｋ
₄、及び減衰定数ｃ₁，ｃ₂，ｃ₃，ｃ₄の機械パラメ
ータで非斉次の応答が表現される。そして第４層の質量
ｍ₄に外乱ｗが作用するときに、構造物は特にその固有
振動数においてｘ₁，ｘ₂，ｘ₃，ｘ₄なる絶対変位で
応答する。図２においては、構造物の第４層に設けら
れ、制御則に基づいて計算される操作量のサーボドライ
バの入力電圧ｕで駆動される能動型動吸振器の付加質量
ｍ_aが、第４層との相対変位ｘ_aで制振するような慣性
力を発生し、構造物の応答を減少させる。いま、能動型
動吸振器の動特性が次の（３）式で示す２次系で同定可
能であるとする。ｘ_a′′′ ＋αｘ_a′′＋βｘ_a′ γ・ｕ …（３）ここでα，β，γは、それぞれ実験的に同定されるパラ
メータであり、′ は時間に関する１回の微分（ｘ_a′
＝ｄｘ_a／ｄｔ）を示す。

【００２５】図２の制御系に対して運動方程式を導き、
これを離散系の状態空間表現にすると、状態方程式は次
のようになる。ここでｋは時間ステップを表す添字であ
る。状態ベクトルはＸ [k]^T＝［ｘ₁，ｘ₂，ｘ₃，ｘ₄，ｘ₁′ ，
ｘ₂′ ，ｘ₃′ ，ｘ₄′ ，ｘ_a，ｘ_a′ ，
ｘ_a′′］^T （ここでＴは転置記号である）制御入力ベクトルはＵ^T＝[u] 外乱ベクトルはＷ^T＝[w] 上記各ベクトルＸ，Ｕ，Ｗを用いた状態方程式（４）を
次に示す。Ｘ′ ＝Ａ・Ｘ＋Ｂ・Ｕ＋Ｄ・Ｗ …（４）（４）式における各マトリックスＡ，Ｂ，Ｄは次の
（５），（６），（７）式となる。

【００２６】

【数１】

【００２７】

【数２】

【００２８】

【数３】

【００２９】なお（５）式のＡマトリックスにおける破
線でかこまた（イ）部は、４層構造物のモデル部分を示
し、破線でかこまれた（ロ）部は、（３）式で示された
能動型動吸振器のモデル部分を示している。また（４）
式中のＡマトリックス要素が零及び非零である点に着目
すると、例として取り上げた能動型動吸振器を用いた制
振制御系において、構造物の動特性に作用している状態
量は、能動型動吸振器の構造物に作用する付加質量によ
る慣性力、すなわち状態量でいうと付加質量の加速度の
みであり、これが干渉項になる。この干渉している物理
量フロー、つまりアクチュエータ慣性力の構造物への作
用を除き、制御対象である構造物とアクチュエータであ
る能動型動吸振器は２つの独立した非干渉の動特性で表
現することが可能である。

【００３０】ここで、干渉の源となっている物理量は必
ずしも独立な状態量である必要はなく、たとえば（３）
式の能動型動吸振器において、動特性が速度と加速度の
代わりに変位と速度で表現される２次系のような場合に
は、干渉するアクチュエータの発生する慣性力、つまり
付加質量に変位と速度の従属変数である加速度を乗じた
ものは、それら独立な状態変数で表現することが可能で
ある。ここで述べたような、非干渉と干渉に基づく物理
量フローの存在という知識を念頭に、この制御対象の動
特性を従来から採用されてきたニューラルネットワーク
で獲得することを考える。

【００３１】図３は本発明における動特性獲得のための
モデルニューラルネットワークの構造を示す図である。
同図において、ニューラルネットワークＡは制御対象で
ある構造物の動特性を表わし、ニューラルネットワーク
Ｂはアクチュエータである能動型動吸振器の動特性を表
現するものとする。状態方程式（４）のＡ及びＤマトリ
ックスより、構造物の動特性は、自らの状態量及び外乱
力を入力としてることがわかり、構造物モデルニューラ
ルネットワークの入力層はそれらの１サンプリング時間
前の変数とすればよい。出力層ユニットからの出力によ
り次の時間ステップにおける制御量を推定するものとす
るが、ここでは制御出力ベクトルが構造物の状態ベクト
ルに等しいと考える。

【００３２】同様に、（４）式のＡ及びＢマトリックス
より、能動型動吸振器の動特性は、自らの状態量及び操
作量であるサーボドライバ入力電圧を入力としているこ
とがわかり、能動型吸振器モデルニューラルネットワー
クの入力層はそれらの１サンプリング時間前の変数とす
ればよい。出力層ユニットからの出力により次の時間ス
テップにおける制御量を推定するものとするが、ここで
は、構造物の場合と同様に制御出力ベクトルが能動型動
吸振器の状態ベクトルに等しいと考える。

【００３３】この実施例においては、入力層（例えば、
図３のニューラルネットワークＡの左端の縦方向白丸の
列で示す）、中間層（入力層と出力層の間の縦方向白丸
の列で示す）、及び出力層（右端の縦方向白丸の列で示
す）を持つ階層型ニューラルネットワークにより制御対
象の動特性を表現するモデルを獲得することを考えてい
る。また入力層の各ユニット（白丸で示す）が中間層の
すべてのユニットとそれぞれ直線で結合され、同様に中
間層の各ユニットが出力層のすべてのユニットとそれぞ
れ直線で結合されている状態が示されているが、これら
は前の層のユニットと後の層のユニットとがすべてウェ
イトを持って結合されていることを表わしている。

【００３４】前記ユニットの出力関数は、一般に広く用
いられているｆ（ｘ）＝ｘのような線形関数、またはｆ
（ｘ）＝１／（１＋ exp^(-x)）もしくはｆ（ｘ）＝１／
（１＋tanh（ｘ））などの非線形関数であるとし、学習
則としてはバックプロパゲーションに代表される階層型
ニューラルネットワークの学習アルゴリズムを用いるも
のとする。この階層型ニューラルネットワークの学習方
法については、既に広く知られているために、ここでの
詳しい説明は省略する。

【００３５】ここで本発明における制御対象の動特性の
同定方法を従来方法と対比して説明する。図４は従来法
による制御対象のニューラルネットワークによる同定方
法を示す図でああり、同図においては、従来技術１で用
いられていたような、前述した干渉、非干渉を考慮した
動特性の分離、及びその物理量フローにもとづいた結合
に関する知識を用いない場合の、動特性を学習するニュ
ーラルネットワークの構造が示される。いま図２の構造
物の動吸振器による制振制御問題にこの方式のニューラ
ルネットワークモデルを用いる場合、入力層には１サン
プル時間前の構造物及び能動型動吸振器の状態量、構造
物への外乱及び、能動型動吸振器への操作電圧が入力さ
れ、出力層のユニットからは構造物及び能動型動吸振器
の１サンプル時間後の状態量を推定するものとする。各
層ユニットの出力関数及びニューラルネットワークの学
習アルゴリズムは前述した本発明手法の場合と同じであ
るとして、両手法による学習の相違を比較した結果を図
５に示す。

【００３６】図５は本発明と従来法による制御対象の同
定・学習における誤差の収束状況を示す図であり、この
モデルニューラルネットワークの学習において、学習係
数及び慣性係数はそれぞれ０．５及び０．３とし、両手
法とも同じ係数値を用いて比較した。この比較におい
て、本発明による動特性に関する既知情報にもとづいで
分離した場合のニューラルネットワークに用いられてい
る結合ウェイト総数は、構造物の動特性推定用ネットワーク：１０×８×８×＝６４０能動型動吸振器の動特性推定用ネットワーク：４×５×３＝６０計：７００とした。

【００３７】これに対して、従来法による非分離のネッ
トワークに用いられている結合ウェイト総数は、構造物＋能動型動吸振器の動特性推定用ネッワーク：１
３×１０×１１＝１４３０とした。これは従来方法で最小繰り返し回数で学習でき
る構造のネットワークの内で最小規模のものであるため
この構造を選んだものである。図５によれば、本発明手
法による方法は従来法の１／２以下と少ない結合ウェイ
ト数を用いているにもかかわらず、推定状態の自乗総和
誤差が従来法の２／３以下のレベルに同じ学習繰り返し
数で達している。結合ウェイト数を勘案すれば実際の計
算所要時間は従来法の５０パーセント程度となるため、
動特性獲得のための計算記憶領域及び学習収束計算時間
は、ともに従来手法の５０パーセントほどに減少されて
いることになり、本発明手法が学習の効率化に極めて有
効であることがわかる。

【００３８】図６は本発明におけるコントローラニュー
ラルネットワークの学習に関する誤差の逆伝播を説明す
る図であり、同図においては、本発明の分離方式ニュー
ラルネットワークによる制御対象動特性を同定した後
に、この学習済みモデルニューラルネットワーク及びコ
ントローラニューラルネットワークを用いて、適応制御
系を構築する際の学習手法を示している。コントローラ
ニューラルネットワークは、未学習の初期状態において
は制御器としての機能を果たさないが、そのように場合
においても系が安全であるように、その結合ウェイトを
微少なランダム値に設定しておく。

【００３９】図６のコントローラニューラルネットワー
クの入力層ユニットには、構造物及び能動型動吸振器の
１ステップ前の状態量である制御対象状態量及びアクチ
ュエータ状態量と外乱が入力され、その出力層ユニット
からは能動型動吸振器のサーボドライバへの操作電圧量
が出力される。ネットワークの出力ユニットからの出力
データは実際の操作量に変換され、計算機のデジタルア
ナログ変換器に書き込まれると同時に、アクチュエータ
モデルニューラルネットワークの入力ユニットに結合さ
れている。実際の制御対象である構造物に例えば風雨や
地震等の外乱が作用する場合、構造物が応答する。この
状態量を検出し、これを減少させるような機能をコント
ローラニューラルネットワークに持たせるために、評価
関数Ｊを以下の（８）式で定義する。ここでは制御量が
状態量に等しいとしている。

【００４０】Ｊ＝∫（Ｘ_s ^TＱ_sＸ_s＋Ｘ_a ^TＱ_aＸ_a＋ｕ^TＲｕ）ｄｔ …（８）ここで、Ｘ_s：構造物の状態量Ｘ_a：能動型動吸振器の状態量ｕ：能動型動吸振器の操作量Ｑ_s，Ｑ_a，Ｒ：重みづけを行うための対角マトリック
スであり、またＸ^TはＸの転置行列を示す。上記（８）式
のうちで、被積分関数第１項に相当する部分は、構造物
のモデルネットワーク出力ユニットより構造物制御量、
たとえば制振本来の目的により第４層応答変位、を誤差
として逆伝播する。また同第２項に相当する部分は能動
型動吸振器のモデルネットワーク出力ユニットより、能
動型動吸振器の制御量、例えば付加質量の原点保持目的
により付加質量変位、を誤差として逆伝播する。ただ
し、構造物モデルニューラルネットワーク内の誤差逆伝
播を最初に行い、能動型動吸振器の加速度の入力ユニッ
トで計算される誤差相当分を、次に計算する能動型動吸
振器の誤差逆伝播において、出力層の加速度出力ユニッ
トに送りこんで逆伝播するようにする。

【００４１】これは、モデル学習の場合と同じように、
制御対象において構造物と能動型動吸振器の動特性の干
渉が能動型動吸振器加速度のみによって生じるという知
識に基づいた誤差逆伝播を行うためである。また、ここ
までの制御量の誤差逆伝播において、学習という表現を
用いていないが、これはモデルニューラルネットワーク
の動特性は既に獲得されているためにこのネットワーク
の結合ウェイトは必ずしも変更する必要はなく、誤差逆
伝播はあくまでも次項に述べるコントローラニューラル
ネットワークの学習上行う必要があることによる。この
ように、モデル内を逆伝播された制御量誤差は、コント
ローラニューラルネットワークの出力層の能動型動吸振
器の操作量出力ユニットに到達する。ここで、（８）式
における被積分関数第３項に基づいて操作量に重みを乗
じたものを、逆伝播で計算してきた誤差相当分に加算
し、操作量自体に制約を設けることが可能である。この
ようにして求めた操作量誤差相当分を出力ユニットより
逆伝播し、モデルニューラルネットワークの学習の項で
も述べたように、階層型ニューラルネットワークの学習
アルゴリズムにもとづいて、結合ウェイトを修正するこ
とでニューラルネットワークコントローラが制御器（レ
ギュレータ）として機能するように収束する。

【００４２】図７は本発明の実施例である制振制御にお
けるコントローラニューラルネットワークの学習・制御
効果を示す図である。同図においては、本発明の（８）
式の評価関数の重み係数として、構造物第４層変位と、
能動型動吸振器変位の２状態量のみに重みづけを行い、
これを減じるようなレギュレータとしてニューラルネッ
トワークコントローラを学習させた場合の制振実験の結
果を示している。この実験においては、時間軸上の時刻
４ｓｅｃの時点でコントローラ学習を開始し、それから
６秒経過した時刻１０ｓｅｃの時点では、図７の（ｂ）
に示すように構造物第４層の変位は、非制御時の約２０
パーセントに変位応答が抑制されている。さらに、能動
型動吸振器変位に重みづけをおこなっているために、制
振装置の付加質量がストロークリミット（図７の（ａ）
の変位±０．０４ｍを越える領域にストロークリミット
は存在する）に至る以前に原点に戻ってきており変位フ
ィードバック制御の効果も得られ、安全な制御を実現し
ている。なお、この実験においては、サンプル時間２０
ｍｓｅｃ内に制御対象モデルニューラルネットワークの
結合ウェイトは調整せず、コントローラニューラルネッ
トワークのみの調整を行っている。

【００４３】なお、前記実施例では、実際の制御対象の
応答を誤差としてモデル内を誤差逆伝播してコントロー
ラニューラルネットワークを学習させているが、本発明
においては、学習済みモデルの制御量推定出力量を用い
てもコントローラの学習は可能である。また、前記実施
例では制御対象モデルニューラルネットワーク結合ウェ
イトを固定して、コントローラニューラルネットワーク
を学習させているが、制御対象が時々刻々変化するよう
な場合には、制御対象モデルニューラルネットワークの
結合重みを適応的に修正し、変動する制御対象に追従し
つつ、コントローラニューラルネットワークを適応的に
収束させることも、本発明により可能である。

【００４４】以上の説明のように、非線形の制御対象の
動特性を同定するのが従来方法では困難な場合や、制御
動作中に動特性や制御仕様が変化する場合に、本発明を
用いて、実際の制御対象の特性をその変動中に同定し、
且つ制御対象又は同定して求められた制御対象と同等モ
デルからの応答に基づき、適応的に応答を調整する適応
制御系を構築することができる。具体的な例としては、
機械プラント、連続ミル、高層建築物の制振等のよう
に、比較的単純モデルの組合せにより非線形モデルが構
成され得る制御対象について、その動特性の同定及び制
御に本発明を適用すると有効である。

【００４５】

【発明の効果】以上説明したように、従来のニューラル
ネットワークを用いた制御対象の動特性の同定、及び学
習したモデルニューラルネットワークに基づくニューラ
ルネットワーク制御系の構築方法においては、多大な収
束計算時間と記憶領域が必要であったが、本発明によれ
ば、ニューラルネットワークを用いて未知の制御対象の
動特性を同定するにあたり、制御対象の干渉あるいは非
干渉の物理的な知識を積極的に用いて一体となっている
ニューラルネットワークをサブシステムの動特性を表現
するモジュールに分離し、各モジュール間の物理的干渉
が既知である場合にはその物理量の流れを考慮した干渉
部分の結合を行い、結果として一体のニューラルネット
ワークに存在していた動特性の同定に寄与しない不要な
結合を排除し、従来の冗長なモデルニューラルネットワ
ークの構造を簡潔化するようにしたので、計算時間の短
縮と記憶領域の削減が可能になり、従来不可能であった
パーソナルコンピュータクラスの計算機によっても、効
率よく適応制御系を構築することが可能となった。

【００４６】また本発明によれば、前記分離した複数の
モデルニューラルネットワークにより同定した動特性を
用いて、前記モデルニューラルネットワークに結合した
コントロールニューラルネットワークを学習させながら
獲得する場合に、前記複数のモデルニューラルネットワ
ーク間の物理的に有意の結合を通して制御量の効率的な
誤差の逆伝播を行なうようにしたので、制御動作中に動
特性や制御仕様が変化しても、制御対象又は同定して求
められた制御対象等と同等モデルからの応答に基づき、
適応的に応答を調整する適応制御系を得ることができ
る。

【図面の簡単な説明】

【図１】本発明に係る制御対象の同定・制御方法の原理
ブロック図である。

【図２】能動型動吸振器による４層構築物を制振する場
合の状態量及び機械パラメータの説明図である。

【図３】本発明における動特性獲得のためのモデルニュ
ーラルネットワークの構造を示す図である。

【図４】従来法による制御対象のニューラルネットワー
クによる同定方法を示す図である。

【図５】本発明と従来法による制御対象の同定・学習に
おける誤差の収束状況を示す図である。

【図６】本発明におけるコントローラニューラルネット
ワークの学習に関する誤差の逆伝播を示す図である。

【図７】本発明の実施例である制振制御におけるコント
ローラニューラルネットワークの学習・制御効果を示す
図である。

【図８】従来手法による制御対象同定・制御システムの
原理ブロック図である。

【図９】先行技術１による非線形制御対象の同定を行な
うニューラルネットワークを示す図である。

【図１０】先行技術２による非線形制御対象の同定・制
御を行なうニューラルネットワーク構成例を示す図であ
る。

【符号の説明】

１１制御対象１１２ＮＮモデル１１３ＮＮモデル１ウェイト調整部２１制御対象２２２ＮＮモデル２２３ＮＮモデル２ウェイト調整部３２ＮＮコントローラ３３ＮＮコントローラウェイト調整部

Claims

【特許請求の範囲】

【請求項１】目標値を維持又は追従する制御量を出力
するアクチュエータと、該アクチュエータの出力により
制御される制御対象から構成される制御系を対象とし、
制御対象の時系列入出力信号を教示データとし、過去の
制御量及び操作量、または制御量、操作量及び外乱を入
力として将来の制御量を推定するように、階層型ニュー
ラルネットワークにより制御系動特性を同定し、該同定
した制御系動特性に基づき前記制御対象の制御を行なう
方法において、制御対象が内部の非干渉性により複数の動特性に分離可
能であるものについて、前記複数の動特性をそれぞれ対
応する複数のニューラルネットワークで同定する同定工
程と、前記複数の各ニューラルネットワーク間は、制御対象内
部で干渉の要因となっている物理量フローで結合する結
合工程とを含むことを特徴とする制御対象の同定・制御
方法。
【請求項２】前記制御対象の複数の動特性をそれぞれ
同定した複数のモデルニューラルネットワークを用い
て、制御量の誤差を干渉する物理量フローとして、前記
複数のモデルニューラルネットワーク間を伝播し、該モ
デルニューラルネットワークに直結するニューラルネッ
トワーク制御器を学習により獲得する学習・獲得工程を
含むことを特徴とする請求項１記載の制御対象の同定・
制御方法。