JP2021051462A

JP2021051462A - 情報処理装置及びプログラム

Info

Publication number: JP2021051462A
Application number: JP2019173165A
Authority: JP
Inventors: 修一矢作; Shuichi Yahagi
Original assignee: Isuzu Motors Ltd
Current assignee: Isuzu Motors Ltd
Priority date: 2019-09-24
Filing date: 2019-09-24
Publication date: 2021-04-01

Abstract

【課題】ＦＲＩＴにおいて制御器パラメータを用いた制御の安定性を向上させる。【解決手段】制御器Ｃと、制御器Ｃの出力を入力とする制御対象Ｐとを備える閉ループ系の制御システムＳにおける制御器Ｃのパラメータを算出する情報処理装置１は、制御システムの入力信号を相補感度関数に印加したときの出力と、制御対象の入力に対する所定の応答を実現するモデルである参照モデルに入力信号を入力した場合の出力との誤差に関する評価関数の評価値に基づいて参照モデルのむだ時間を含む制御パラメータを推定する。そして、情報処理装置１は、所定の適正化アルゴリズムを用いて、参照モデルの応答性のパラメータ（１次遅れの参照モデルの場合は時定数）を適正化する。【選択図】図６

Description

本発明は情報処理装置及びプログラムに関し、特に、閉ループ系の制御器の制御パラメータを設定する技術に関する。

閉ループ系における制御対象のモデルを用いない制御手法が種々提案されている。このようなモデルを用いない制御器パラメータの自動調整手法の一つとしてＦＲＩＴ（Fictitious Reference Iterative Tuning）が知られている（特許文献１参照）。

特開２０１７−１８２６２４号公報

ＦＲＩＴ等のデータ駆動制御により得られた制御パラメータを用いて閉ループ系を制御すると、系が不安定となる場合がある。特に、ＦＲＩＴで用いられる参照モデルの応答を実現する制御パラメータが存在しない場合に系が不安定となりやすいことが知られている。

本発明はこれらの点に鑑みてなされたものであり、ＦＲＩＴにおいて制御器パラメータを用いた制御の安定性を向上させるための技術を提供することを目的とする。

本発明の第１の態様の情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、を備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器のパラメータを算出する情報処理装置であって、前記制御器の出力の時系列データである第１時系列データと、前記制御対象の出力の時系列データである第２時系列データとを取得する時系列データ取得部と、前記制御器のパラメータ、前記第１時系列データ、及び前記第２時系列データから、前記制御器に入力する入力信号の時系列データの推定値である第３時系列データを推定する入力信号推定部と、前記第２時系列データと前記第３時系列データとに基づいて、前記制御器に対する相補感度関数を算出する相補感度関数算出部と、前記制御システムの入力信号を前記相補感度関数に印加したときの出力である第４時系列データを算出するプラント出力算出部と、前記制御対象の入力に対する所定の応答を実現するモデルである参照モデルに前記入力信号を入力した場合の出力の時系列データである第５時系列データを取得するモデル出力取得部と、前記第４時系列データと前記第５時系列データとの誤差に関する評価関数の評価値に基づいて前記参照モデルのむだ時間であるモデルむだ時間および制御器のパラメータを決定し、決定した前記モデルむだ時間および前記制御器のパラメータを用いる適正化アルゴリズムを実行することにより前記参照モデルの応答性のパラメータを決定するパラメータ決定部と、を備える。

前記パラメータ決定部は、例えば、前記評価値が最小になるように前記モデルむだ時間を推定し、前記制御対象にデータを入力してから当該データが出力されるまでの遅延時間に対応する制御対象むだ時間を取得し、推定した前記モデルむだ時間と取得した前記制御対象むだ時間とを前記適正化アルゴリズムに適用することにより前記応答性のパラメータを適正化する。応答性のパラメータは、１次遅れ系の場合には時定数とよばれるが、他システムの応答性に関するパラメータを対象としてもよい。

前記パラメータ決定部は、前記参照モデルの推定むだ時間が前記制御対象むだ時間よりも大きい場合に、前記参照モデルの時定数を大きくしてもよい。

前記パラメータ決定部は、前記参照モデルの推定むだ時間が前記制御対象むだ時間よりも大きい場合に、前記制御器の次数を大きくしてもよい。

本発明の第２の態様のプログラムは、制御器と、前記制御器の出力を入力とする制御対象と、を備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器のパラメータを算出するコンピュータに、前記制御器の出力の時系列データである第１時系列データを取得する機能と、前記制御対象の出力の時系列データである第２時系列データを取得する機能と、前記制御器のパラメータ、前記第１時系列データ、及び前記第２時系列データから、前記制御器に入力する入力信号の時系列データの推定値である第３時系列データを推定する機能と、前記第２時系列データと前記第３時系列データとに基づいて、前記制御器に対する相補感度関数を算出する機能と、前記制御システムの入力信号を前記相補感度関数に印加したときの出力である第４時系列データを算出する機能と、前記制御対象の入力に対する所定の応答を実現するモデルである参照モデルに前記入力信号を入力した場合の出力の時系列データである第５時系列データを取得する機能と、前記第４時系列データと前記第５時系列データとの誤差に関する評価関数の評価値に基づいて前記参照モデルのむだ時間であるモデルむだ時間を決定する機能と、決定した前記モデルむだ時間および前記制御器のパラメータを用いる適正化アルゴリズムを実行することにより前記参照モデルの応答性のパラメータを適正化する機能と、を実現させる。

本発明によれば、ＦＲＩＴにおいて制御器パラメータを用いた制御の安定性を向上させることができる。

標準的なＦＲＩＴを説明するための図である。安定性を考慮したＦＲＩＴの構成を模式的に示す図である。制御システムが応答性パラメータを決定する処理のフローチャートである。制御システムにステップ入力を印加したときのシミュレーションの結果を示す図である。制御システムＳがむだ時間を有する制御対象に対してモデルむだ時間を含む制御パラメータを自動調整したパラメータを用いた場合の閉ループ系の時間履歴を示す図である。実施の形態に係る情報処理装置の機能構成を模式的に示す図である。実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。

［１．概略］
ＦＲＩＴや非反証制御等のデータ駆動制御により得られた制御パラメータを用いて制御を行うと、閉ループ系が不安定化する場合がある。特に、制御器の構造上、参照モデルの応答を実現する制御パラメータが存在しない場合に不安定化が生じやすいことが知られている。この問題はSafonovが提案した擬似参照入力を使用する場合に生じる。

Engellらは、上記の問題が発生する原因として、プラント出力から擬似誤差（擬似参照信号とプラント出力の誤差）の伝達関数を求める際に不安定極が相殺されてしまうため、閉ループ系の不安定化を検知できないことを示している。そこで、Engellらは、擬似参照入力と擬似誤差に関する感度関数を入出力データから求めた後、得られた感度関数に目標値を印加し感度関数の出力である誤差を求めることを提案した。これにより、不安定極を相殺することなく感度関数の出力である誤差を求めることができ、閉ループ系の不安定化を検知することができる。Engellらの手法において、感度関数はＦＩＲ（Finite Impulse Response）モデルに基づいて同定される。このため、感度関数の同定にプラントモデルの構造は不要である。さらに、時間領域で計算していることからオンライン計算への展開が可能となる。

Engellらは感度関数の出力である誤差を最小にする評価関数を設定した。これに対し、実施の形態に係る手法は、閉ループ系と設計者が設定した参照モデルとが一致するような評価関数を設定する。具体的には、本実施の形態では、まず、擬似参照入力を利用し、調整する制御器に対する相補感度関数を求める。すなわち相補感度関数の出力は制御パラメータの関数となる。次に、設計者が与えたい目標値を相補感度関数に印加しその出力を求める。相補感度関数の出力はプラントからの出力である。すなわち、相補感度関数の出力を見ることにより、ＦＲＩＴにおいて制御器パラメータを用いた制御の安定性を評価することができる。

実施の形態に係る手法では、相補感度関数から得られた出力と設計者が設定した参照モデルの出力の二乗誤差が最小になる制御器パラメータを粒子群最適化等の最適化手法により求める。これにより、標準的なＦＲＩＴでは閉ループ系が不安定になる場合であっても、本実施の形態では安定な制御パラメータが得られる。これにより、実施の形態は標準ＦＲＩＴの利点を活かしたまま不安定化を軽減することができる。

［２．安定性を考慮したＦＲＩＴの導出］
［２．１．標準ＦＲＩＴ］
図１は、標準的なＦＲＩＴを説明するための図である。図１に示す閉ループ系の制御システムＳにおいて、制御器Ｃは制御に用いるパラメータθを引数とする関数Ｃ（θ）で表現されている。図１に示す制御システムＳは、制御対象Ｐの出力ｙと後述する参照モデルＭの出力とを一致させることが目的である。具体的には、この目的を達成するために制御対象Ｐに入力すべき制御量ｕを出力するようなパラメータθを特定することが目的である。なお、図１において、θは自由に調整できるパラメータであり、ｕ及びｙは観測により取得可能なデータである。また、ｄは制御システムＳの目標値である。

ＦＲＩＴは１組の入出力データと参照モデルＭとから、制御システムＳの制御器Ｃのパラメータθを自動調整する手法である。初期のパラメータθを用いて１組の閉ループ実験を行い、そのときの入出力データｕ及びｙをサンプリングして計測する。このとき、制御システムＳは安定であるとする。図１より、Ｃ（θ）（ｒ−ｙ）＝ｕであるから、制御システムＳの目標値ｄの推定値である擬似参照信号ｒはｕ及びｙを用いて以下の式（１）で表せる。
ｒ（θ，ｋ）＝Ｃ^-１（θ）ｕ（ｋ）＋ｙ（ｋ）（１）

図１に示す一般的なフィードバック制御の応答と、参照モデルＭ（ｚ）及び擬似参照信号ｒ（θ，ｋ）から得られる目標応答との誤差に関する評価関数Ｊ_θは次式（２）で表される。

この評価関数Ｊ_θを最小にする制御器Ｃのパラメータθは、制御対象Ｐの出力であるプラント出力ｙ（ｋ）と参照モデルＭの出力Ｍ（ｚ）ｒ（θ，ｋ）との二乗誤差を最小化するという意味において、制御器Ｃの最適なパラメータθである。一般的なＦＲＩＴでは、オフライン計算で最適なパラメータθが計算される。なお、評価関数は式（２）に示す形に限られず、制御入力等の制約を考慮したものであってもよい。

式（１）から明らかなように、ＦＲＩＴは閉ループ系の制御システムＳの伝達関数と参照モデルがマッチングする最適な制御器パラメータを求めることを目的としている。すなわち、ＦＲＩＴは、以下の式（２）で表される評価関数を最小にする最適パラメータを求める。ＦＲＩＴは擬似参照信号ｒ（θ，ｋ）を利用して、閉ループ試験を繰り返すことなく実験により取得した１組の入出力データを用いてオフラインで最適制御パラメータを求めるデータ駆動制御の１つであるともいえる。

ＦＲＩＴの評価関数Ｊ_θ、擬似参照信号ｒ（θ，ｋ）、及び擬似誤差ｅ（θ，ｋ）は次式で表される。

［２．２．安定性を考慮したＦＲＩＴ］
擬似参照信号ｒ（θ，ｋ）を用いる場合にはＦＲＩＴの閉ループ系の不安定化を検知できない。そこで、まず、擬似参照信号ｒ（θ，ｋ）とプラント出力ｙ_０を用いて時間領域における相補感度関数を求める。求めた相補感度関数に目標値ｄを印加し、その応答ｙ^＊を求める。この応答ｙ^＊が参照モデルＭの応答Ｍ（ｚ）ｒ（θ，ｋ）と一致するような制御器パラメータを求める。なお、相補感度関数の同定はＦＩＲモデルを用いる。これにより、制御対象Ｐの構造を知る必要はなく、取得したデータのみを用いて相補感度関数を同定することができる。

まず、ラプラス領域における感度関数と相補感度関数とについて説明する。
パラメータθの調整対象とする制御器Ｃの感度関数Ｓは次式（６）で表される。

調整対象とする制御器Ｃの相補感度関数Ｔは次式（７）で表される。

なお、感度関数Ｓと相補感度関数Ｔとの関係は次式（８）となる。
Ｓ（ｓ）＋Ｔ（ｓ）＝１（８）

続いて、時間領域における擬似参照信号ｒ（θ，ｋ）とプラント出力ｙ_０との関係について説明する。時間領域における擬似参照信号ｒ（θ，ｋ）とプラント出力ｙ_０との関係は次式（９）となる。

式（９）において、記号＊は畳み込みを表し、ｔ（ｋ）は相補感度関数Ｔのインパルス応答を表す。擬似参照信号ｒ（θ，ｋ）とプラント出力ｙ_０とは観測可能であるが、相補感度関数Ｔのインパルス応答ｔ（ｋ）は未知である。

式（９）は行列を用いて表すと以下の式（１０）となる。

式（１０）の左辺をベクトルｙ_０、右辺第１項を行列Ｒ_θ、右辺第２項をベクトルｔとすると、相補感度関数Ｔのインパルス応答ｔ（ｋ）は、以下の式（１１）で表される。

式（１１）は、式（９）のデコンボリューションともいえる。ｔは、パラメータθに依存する。

制御システムＳの入力信号ｄ（目標値）を相補感度関数Ｔに印加した場合の出力ｙ^＊を時間領域で表すと、次式（１２）となる。

式（１２）は行列を用いて表すと以下の式（１３）となる。

式（１３）の左辺をベクトルｙ^＊、右辺第１項を行列Ｄ、右辺第２項をベクトルｔとし、式（１１）を用いてｔを消去すると、式（１３）は式（１４）に変形できる。

式（１４）の右辺は全て観測により取得可能であるから、制御器Ｃを用いたときの目標値ｄを閉ループ系の制御システムＳに印加したときの出力ベクトルｙ^＊を演算により取得することができる。この出力ベクトルｙ^＊と参照モデルＭの出力ｙ_ｄ（ｋ）＝Ｍ（ｚ）ｄ（ｋ）との誤差ｅ^＊の二乗和を、次式（１５）で表される評価関数Ｊ^＊（θ）とする。

式（１５）において、
ｅ^＊（θ，ｋ）＝ｙ^＊（θ，ｋ）−ｙ_ｄ（ｋ）（１６）
である。

標準的なＦＲＩＴでは、取得したプラント出力ｙ_０に一致するようにパラメータθの関数である擬似参照信号ｒ（θ，ｋ）を調整する。これに対し、実施の形態に係る手法では、参照モデルＭの出力Ｍ（ｚ）ｄ（ｋ）にプラント出力ｙ_０が一致するように、パラメータθを調整してプラント出力ｙ^＊を変更する。すなわち、標準的なＦＲＩＴは実験によりあらかじめ取得したプラント出力に合うようにパラメータθを求めているのに対し、実施の形態に係る手法は参照モデルの出力Ｍ（ｚ）ｄ（ｋ）に合うように、パラメータθを求める。

［２．３．安定性を考慮したＦＲＩＴの構成］
図２は、安定性を考慮したＦＲＩＴの構成を模式的に示す図である。まず、パラメータθが初期値θ_０のときの制御システムＳの入出力データから擬似参照信号ｒ（θ）が算出される。算出された擬似参照入力とプラント出力ｙとを用いて相補感度関数ｔを上記式（１１）を用いて求められ、制御システムＳの入力信号である目標値ｄを相補感度関数ｔに入力される。相補感度関数ｔの出力である出力ｙ^＊と、参照モデルの出力Ｍ（ｚ）ｄとの誤差を最小にする制御器Ｃのパラメータθが、最適化手法により求められる。

［２．４．むだ時間を利用した参照モデルの自動調整］
参照モデルが適切でない場合には、ＦＲＩＴの性能が劣化することが知られている。そこで、制御システムＳは、参照モデルＭのむだ時間を評価関数に含め、評価関数を最小とする参照モデルＭの推定むだ時間を制御対象の実際のむだ時間と比較することにより、参照モデルＭを適正化する。

具体的には、制御システムＳは、まず制御対象にデータを入力してから出力されるまでの遅延時間に基づいて、制御対象の実際のむだ時間（以下、「制御対象むだ時間」という。）を特定する。制御システムＳにおいては、可変参照モデルを導入することで、むだ時間Ｌ_ｅｓｔも制御パラメータとして扱うことができる。また、制御システムＳは、従来の参照モデルと同様に、設計値である時定数τ_Ｍを決定する。

制御システムＳは、参照モデルＭを用いた以下の評価関数を最小化することができるＰＩＤゲイン及びむだ時間を推定する。

ここで、むだ時間が大きく推定されることにより評価関数が最小化されてしまう場合がある。この場合、制御システムＳは、所望の応答特性を得ることができない。そこで、制御システムＳは、推定されたむだ時間が制御対象の制御対象むだ時間とほぼ等しいということを条件としてＰＩＤゲインを決定する。具体的には、制御システムＳは以下の手順により、推定されたむだ時間と制御対象のむだ時間とを比較した結果に基づいて、時定数を適正化する。それによりむだ時間及びＰＩＤゲインを自動調整され、高い制御性能が得られる。

まず、制御システムＳは、推定されたむだ時間を制御対象の制御対象むだ時間と比較する。推定したむだ時間が制御対象むだ時間よりも大きい場合、制御器Ｃの次数を大きくすることにより、より高精度に制御できるようにしたり、目標参照応答をより遅くしたりする必要がある。

図３は、制御システムＳが応答性パラメータを決定する処理のフローチャートである。以下、図３を参照しながら、制御システムＳが実行する処理の詳細を説明する。

（第１ステップ）事前に取得した入出力データに基づいて制御対象むだ時間を特定する（Ｓ１０１）。制御システムＳは、例えばＦＲＩＴの初期の処理において初期のパラメータθを用いて１組の入出力データｕ及びｙを計測した結果に基づいて制御対象むだ時間を特定することができる。

（第２ステップ）参照モデルＭを含めた安定性を考慮したＦＲＩＴの評価関数を最小化するパラメータを特定する。
（第３ステップ）ＰＩＤゲイン及び参照モデルＭのむだ時間を推定する（Ｓ１０２）。
（第４ステップ）推定したむだ時間と制御対象むだ時間とを比較することにより（Ｓ１０３）、参照モデルＭの時定数を調整するパラメータ適正化アルゴリズムを実行する。

制御システムＳは、参照モデルＭの時定数を調整する際、推定したむだ時間が制御対象むだ時間よりも大きい場合（Ｓ１０３においてＮＯ）、以下のいずれかの処理（Ｓ１０４）を実施した後に第２ステップに戻る。
（１）参照モデルＭの時定数を大きくする。
（２）制御器Ｃの次数を大きくする。
制御器ＣがＰＩＤ制御である場合、制御システムＳは制御器Ｃの次数を変化させずに参照モデルＭの時定数を大きくする。

一方、制御システムＳは、推定したむだ時間が制御対象むだ時間以下である場合には（Ｓ１０３においてＹＥＳ）、むだ時間が最適な値になっている（すなわち参照モデルＭの時定数が適正化できた）と判定し、参照モデルＭの時定数及び制御器Ｃの次数を変化させないで処理を終了する。

［３．シミュレーションによる検証］
［３．１．システムの定式化］
本願の発明者は、安定性を考慮したＦＲＩＴについてシミュレーションを用いて検証した。そこで、まず、シミュレーションで用いる制御対象Ｐ、参照モデルＭ、制御器Ｃの定式化を行う。

制御対象Ｐは次式（１７）に示すように、ばね質量系とする。ここで、ｍ、ｃ、ｋ、及びＬは、それぞれ質量、粘性係数、ばね剛性、及びむだ時間を表す。

参照モデルＭは、次式（１８）に示すように１次遅れ系とする。ここで、τ_Ｍはシステムの応答に関するパラメータであり、設計者が設定する。

制御器Ｃとしては次式（１９）に示すＰＩＤ（Proportional-Integral-Differential）制御器を用いる。ここで、Ｋ_ｐ、Ｋ_ｉ、及びＫ_ｄはそれぞれ、Ｐゲイン、Ｉゲイン、及びＤゲインである。

［３．２．シミュレーション］
シミュレーションにおいてサンプリング周期は４ミリ秒とし、制御器Ｃの離散化はゼロ次ホールドを用いた。なお、最適化計算には粒子群最適化を用いた。

図４は、制御システムにステップ入力を印加したときのシミュレーションの結果を示す図である。具体的には、図４（ａ）−（ｂ）は、従来のＦＲＩＴと実施の形態に係る手法とのそれぞれにより調整したパラメータθによる制御システムＳの入出力データの時間履歴を示す図である。具体的には、図４（ａ）において、破線は参照応答、実線は実施の形態に係る手法における制御システムＳの出力、一点鎖線は従来のＦＲＩＴにおける制御システムＳの出力を示している。図４（ａ）より、標準ＦＲＩＴでは制御システムＳの出力が発散してグラフの枠内に収まっていないのに対し、実施の形態に係る手法は、制御の構造上モデルマッチングが実現できない場合においても閉ループ系である制御システムＳが安定となる制御器Ｃのパラメータθが得られていることがわかる。

図４（ｂ）は、図４（ａ）に対応する入力信号を示す図である。図４（ａ）と同様に、実線は実施の形態に係る手法における入力、一点鎖線は従来のＦＲＩＴにおける入力を示している。図４（ｂ）より、標準ＦＲＩＴでは入力も不安定となっている。一方、実施の形態に係る手法では、入力も安定している。

図５は、制御システムＳがむだ時間を有する制御対象に対してモデルむだ時間を含む制御パラメータを自動調整したパラメータを用いた場合の閉ループ系の時間履歴を示す図である。図５（ａ）は、参照モデルＭの時定数を５ｍｓとしたときの結果を示しており、図５（ｂ）は、時定数を３００ｍｓとしたときの結果を示している。図５における横軸は時間であり、縦軸は入出力である。図５における破線は参照応答を示しており、実線は実施の形態に係る手法における制御システムＳの出力を示している。

図５（ａ）において破線で示す参照応答が立ち上がり始めるまでの時間が、推定されたむだ時間である。図５（ａ）から、指定した次数の制御器Ｃ（ＰＩＤ制御器）で実現できない応答を要求した場合には、むだ時間が実際より大きく推定されることがわかる。これは誤差の二乗和をより小さくするためであると考えられる。

また、図５（ｂ）より、上記の手順で参照モデルＭの時定数を調整していくことで、式（１３）を最小化したときに得られるむだ時間Ｌ_ｅｓｔが適切になり、指定された次数の制御器Ｃで参照応答に実応答が追従できていることがわかる。また、むだ時間の推定精度も高いことが確認できる。

以上のとおり、制御システムＳが、参照モデルＭの自動調整を実現できることを確認できた。図５（ａ）と図５（ｂ）の結果を比較すると、図５（ｂ）の結果においては、実応答がオーバシュートすることなく、ほぼ同時間に定常目標値に到達している。この結果から、制御システムＳは、むだ時間の推定値と実値に着目し、参照モデルＭの時定数を適正化することにより、より良い制御性能が得られることがわかる。

［４．小括］
従来のＦＲＩＴでは、制御器Ｃのパラメータθの最適解を用いて制御しても、閉ループ系の挙動が不安定になるという問題があった。実施の形態に係る手法では、時間領域で擬似参照信号ｒ（θ，ｋ）とプラント出力ｙとの伝達関数である相補感度関数Ｔを同定することで、誤差を正しく検知することを可能にした。実施の形態に係る手法により、閉ループ系が安定である制御器Ｃのパラメータθを求められる。また、むだ時間を利用して参照モデルＭを自動調整することで、閉ループ系の安定性をさらに向上させることができる。

［５．参考文献］
（ＦＲＩＴ）
・相馬将太郎, 金子修, 藤井隆雄, 一回の実験データに基づく制御器パラメータチューニングの新しいアプローチ Fictitious Reference Iterative Tuning の提案, システム制御情報学会論文誌, Vol. 17, No.12 (2004), pp. 528-536
・奥谷明大, 金子修, 山本茂, ＦＲＩＴを用いた多入出力むだ時間系に対するスミス補償器のチューニング, システム制御情報学会論文誌, Vol. 28, No 2 (2015), pp. 58-65
・データを直接用いた制御器のパラメータチューニング, 金子修, 計測と制御, Vol.43, No.11 (2008), pp903-908

（非反証制御）
・M. G. Safonov and T. C. Tsao, The unfalsified control, concept and learning, IEEE Trans. on Automat.Contr., Vol. 42, No. 6, pp. 843-847 (1997)

（安定性の考慮）
・弓場井一裕, 藤井宏樹, 平井淳之, パラメータ更新時の閉ループシステムの安定性を考慮したFCbTの提案, 電気学会論文誌Ｄ（産業応用部門誌）, Vol.132, No.6 (2011),pp. 607-615
・Kazuhiro Yubai, Hiroki Fujii, Junji Hirai, Fictitious Correlation-based Tuning Integrating the Data-Based Stability Test at Each Parameter Update, Electrical Power Systems and Computers, LNEE 99, pp. 511-518.

（擬似参照信号の問題と安定性）
・S. Engell, T. Tometzki and T. Wonghong, A New Approach to Adaptive Unfalsified Control. In Proc. European Control Conf., Kos, 2007, 1328-1333.
・T. Wonghong and S. Engell, Application of a New Scheme for Adaptive Unfalsified Control to a CSTR. Proc. IFAC World Congress, Korea, 13247-13252, 2008.

［６．実施の形態］
以上を踏まえ、本発明の実施の形態について説明する。

図６は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図６において、矢印は主なデータの流れを示しており、図６に示していないデータの流れがあってもよい。図６において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図６に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報を格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによって時系列データ取得部３０、入力信号推定部３１、相補感度関数算出部３２、プラント出力算出部３３、モデル出力取得部３４、及びパラメータ決定部３５として機能する。

なお、図６は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

情報処理装置１は、制御器Ｃと制御器Ｃの出力を入力とする制御対象Ｐとを備える制御システムＳにおいて、制御器Ｃのパラメータθを算出するための装置である。図６に示すように、制御システムＳは、制御対象Ｐの出力が制御器Ｃの入力にフィードバックされる閉ループ系である。

時系列データ取得部３０は、制御器Ｃの出力の時系列データである第１時系列データと、制御対象Ｐの出力の時系列データである第２時系列データとを取得する。ここで、第１時系列データは上述した制御対象Ｐに入力すべき制御量ｕに対応し、第２時系列データは上述した制御対象Ｐの出力ｙに対応する。したがって、以下本明細書において、「第１時系列データｕ」、「第２時系列データｙ」と記載することがある。

入力信号推定部３１は、制御器Ｃのパラメータθ、第１時系列データｕ、及び第２時系列データｙから、制御器Ｃに入力する入力信号の時系列データの推定値である第３時系列データを推定する。第３時系列データは、上述した擬似参照信号ｒ（θ，ｋ）に対応する。したがって、以下、「第３時系列データｒ（θ）」と記載することがある。

相補感度関数算出部３２は、第２時系列データｕと第３時系列データｒ（θ）とに基づいて、上述した式（１１）を用いて制御器Ｃに対する相補感度関数ｔを算出する。プラント出力算出部３３は、上述した式（１２）又は式（１３）を用いて、制御システムＳの入力信号ｄを相補感度関数ｔに印加したときの出力である第４時系列データを算出する。第４時系列データは、制御システムＳの入力信号ｄ（目標値）を相補感度関数Ｔに印加した場合の出力ｙ^＊に対応する。したがって、以下、「第４時系列データｙ^＊」と記載することがある。

制御対象Ｐに入力すべき制御量である第１時系列データｕ、制御対象Ｐの出力である第２時系列データｙ、及び制御システムＳの入力信号である第４時系列データｄは、いずれも観測により取得可能な量である。情報処理装置１は、観測により取得した第１時系列データｕ、第２時系列データｙ、及び入力信号ｄを用いることで、制御システムＳに入力信号ｄを入力したときの出力ｙ^＊を算出することができる。出力ｙ^＊は、プラント（制御対象Ｐ）からの出力である。情報処理装置１は、この出力ｙ^＊の振る舞い（例えば、発散するか否か、振動するか否か、収束するか否か等）を解析することで、ＦＲＩＴにおいて制御器Ｃのパラメータθを用いたプラントの制御の安定性を評価することができる。

図２及び図６に示すように、制御システムＳは制御対象Ｐの入力信号ｄに対する出力を所定の出力とすることを実現する参照モデルＭを備えている。なお、参照モデルＭは、制御対象Ｐの出力が設計者が希望する出力となるように、設計者が決定する。モデル出力取得部３４は、参照モデルＭに入力信号ｄを入力した場合の出力の時系列データである第５時系列データを取得する。第５時系列データは、上述した参照モデルの出力Ｍ（ｚ）ｄに対応する。以下、第５時系列データを「第５時系列データｙ_ｄ」と記載することがある。

ここで、情報処理装置１がＦＲＩＴにおける制御器Ｃのパラメータθを用いた制御の安定性を評価することができるのであれば、情報処理装置１は、制御が安定化するようにパラメータθを最適化することもできる。これを実現するために、パラメータ決定部３５は、第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差に関する評価関数Ｊ^＊（θ）の評価値に基づいて、制御器Ｃのパラメータθを更新する。

より具体的には、上述した式（１５）及び式（１６）に示すように、パラメータ決定部３５が用いる評価関数Ｊ^＊（θ）は、第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差の二乗和である。パラメータ決定部３５は、評価関数Ｊ^＊（θ）の評価値が小さくなるように、反復処理によって制御器Ｃのパラメータθを更新する。すなわち、パラメータ決定部３５は、第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差の二乗和が小さくなるという意味において最適なパラメータθを反復によって求める。

一般に、第４時系列データｙ^＊が発散したり振動したりすると、第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差の二乗和は大きくなる。パラメータ決定部３５が第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差の二乗和が小さくなるように制御器Ｃのパラメータθを更新することにより、情報処理装置１は、ＦＲＩＴにおいて制御器Ｃのパラメータθを用いたプラントの制御を安定化させることができる。

また、パラメータ決定部３５は、評価関数の評価値に基づいて参照モデルＭのむだ時間であるモデルむだ時間を推定する。パラメータ決定部３５は、例えば、評価値が最小になるようにモデルむだ時間を推定する。パラメータ決定部３５は、制御対象にデータを入力してから当該データが出力されるまでの遅延時間に対応する制御対象むだ時間を取得し、推定したモデルむだ時間と取得した制御対象むだ時間とを所定のパラメータ適正化アルゴリズムに適用することで、参照モデルＭの応答性のパラメータを決定する。具体的には、パラメータ決定部３５は、参照モデルＭの推定むだ時間が制御対象むだ時間よりも大きい場合に、参照モデルＭの時定数を大きくする。パラメータ決定部３５は、参照モデルＭの推定むだ時間が制御対象むだ時間よりも大きい場合に、制御器Ｃの次数を大きくしてもよい。

なお、パラメータ決定部３５は、評価関数の評価値が小さくなるように制御器Ｃのパラメータθを更新できるのであればどのような最適化手法を用いてもよい。一例としてパラメータ決定部３５は、あらかじめ定められた所定の回数を反復回数の上限として、粒子群最適化の手法を用いて制御器Ｃのパラメータθを更新してもよい。

＜情報処理装置１が実行する情報処理方法の処理フロー＞
図７は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

時系列データ取得部３０は、制御器Ｃの出力の時系列データである第１時系列データｕを取得する（Ｓ２）。また、時系列データ取得部３０は、制御対象Ｐの出力の時系列データである第２時系列データｙを取得する（Ｓ４）。

入力信号推定部３１は、制御器Ｃのパラメータθ、第１時系列データｕ、及び第２時系列データｙから、式（１）を用いて、制御器Ｃに入力する入力信号ｄの時系列データの推定値である第３時系列データｒ（θ）を推定する（Ｓ６）。

相補感度関数算出部３２は、第２時系列データｙと第３時系列データｒ（θ）とに基づいて、式（１１）を用いて制御器Ｃに対する相補感度関数ｔ（すなわち、擬似参照信号ｒ（θ，ｋ）に対する相補感度関数ｔ）を算出する（Ｓ８）。プラント出力算出部３３は、式（１４）を用いて、制御システムＳの入力信号ｄを相補感度関数ｔに印加したときの出力である第４時系列データｙ^＊（すなわち、入力信号ｄに対する制御対象Ｐの出力）を算出する（Ｓ１０）。

モデル出力取得部３４は、参照モデルＭに入力信号ｄを入力した場合の出力の時系列データである第５時系列データｙ_ｄを取得する（Ｓ１２）。パラメータ決定部３５は、式（１５）及び式（１６）を用いて、第４時系列データｙ^＊と第５時系列データｙ_ｄとの誤差に関する評価関数Ｊ（θ）の評価値を算出する（Ｓ１４）。パラメータ決定部３５は、評価関数Ｊ（θ）の評価値が小さくなるように、制御器Ｃの制御パラメータθを更新する（Ｓ１６）。

ステップＳ１６の処理において、パラメータ決定部３５は、ステップＳ２で第１時系列データｕを取得したタイミングとステップＳ４で第２時系列データｙを取得したタイミングとの時間差に基づいて、制御対象の実際のむだ時間を特定する。パラメータ決定部３５は、評価値が小さくなるようにパラメータθを決定した状態で参照モデルＭのむだ時間を推定し、推定したむだ時間が制御対象の実際のむだ時間よりも大きい場合に、参照モデルＭの時定数を大きくしたり、制御器Ｃの実数を大きくしたりする。パラメータ決定部３５は、推定したむだ時間が制御対象の実際のむだ時間以下になるまでこの処理を反復することにより、むだ時間が最適な値になるように調整する。

パラメータ決定部３５は、制御器Ｃのパラメータθを更新すると、図３を参照して説明したパラメータ適正化アルゴリズムを実行する。具体的には、パラメータ決定部３５は、推定したむだ時間が制御対象むだ時間よりも大きい場合（Ｓ１８においてＮＯ）、参照モデルＭの時定数を大きくしたり、制御器Ｃの次数を大きくしたりする（Ｓ２０）。その後、情報処理装置１は、処理をＳ２に戻す。一方、パラメータ決定部３５は、推定したむだ時間が制御対象むだ時間以下である場合には（Ｓ１８においてＹＥＳ）、むだ時間が最適な値になっていると判定し、参照モデルＭの時定数及び制御器Ｃの次数を変化させないでパラメータ適正化アルゴリズムを終了する。情報処理装置１は、上記の処理をオンラインで繰り返すことにより、制御器Ｃのパラメータθの更新を継続する。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、ＦＲＩＴにおいて制御器Ｃのパラメータθを用いたプラントの制御の安定性を向上させることができる。また、情報処理装置１は、閉ループ系の制御が安定化するようにＦＲＩＴにおける制御器Ｃのパラメータθを最適化することもできる。また、情報処理装置１は、参照モデルのむだ時間を最適化することにより、制御器Ｃのパラメータθをさらに改善することができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

１・・・情報処理装置
２・・・記憶部
３・・・制御部
３０・・・時系列データ取得部
３１・・・入力信号推定部
３２・・・相補感度関数算出部
３３・・・プラント出力算出部
３４・・・モデル出力取得部
３５・・・パラメータ決定部
Ｃ・・・制御器
Ｍ・・・参照モデル
Ｐ・・・制御対象
Ｓ・・・制御システム

Claims

制御器と、前記制御器の出力を入力とする制御対象と、を備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器のパラメータを算出する情報処理装置であって、
前記制御器の出力の時系列データである第１時系列データと、前記制御対象の出力の時系列データである第２時系列データとを取得する時系列データ取得部と、
前記制御器のパラメータ、前記第１時系列データ、及び前記第２時系列データから、前記制御器に入力する入力信号の時系列データの推定値である第３時系列データを推定する入力信号推定部と、
前記第２時系列データと前記第３時系列データとに基づいて、前記制御器に対する相補感度関数を算出する相補感度関数算出部と、
前記制御システムの入力信号を前記相補感度関数に印加したときの出力である第４時系列データを算出するプラント出力算出部と、
前記制御対象の入力に対する所定の応答を実現するモデルである参照モデルに前記入力信号を入力した場合の出力の時系列データである第５時系列データを取得するモデル出力取得部と、
前記第４時系列データと前記第５時系列データとの誤差に関する評価関数の評価値に基づいて前記参照モデルのむだ時間であるモデルむだ時間および制御器のパラメータを決定し、決定した前記モデルむだ時間および前記制御器のパラメータを用いる適正化アルゴリズムを実行することにより前記参照モデルの応答性のパラメータを決定するパラメータ決定部と、
を備える情報処理装置。
前記パラメータ決定部は、前記評価値が最小になるように前記モデルむだ時間を推定し、前記制御対象にデータを入力してから当該データが出力されるまでの遅延時間に対応する制御対象むだ時間を取得し、推定した前記モデルむだ時間と取得した前記制御対象むだ時間とを前記適正化アルゴリズムに適用することにより前記応答性のパラメータを適正化する、
請求項１に記載の情報処理装置。
前記パラメータ決定部は、前記参照モデルの推定むだ時間が前記制御対象むだ時間よりも大きい場合に、前記参照モデルの時定数を大きくする、
請求項２に記載の情報処理装置。
前記パラメータ決定部は、前記参照モデルの推定むだ時間が前記制御対象むだ時間よりも大きい場合に、前記制御器の次数を大きくする、
請求項２に記載の情報処理装置。
制御器と、前記制御器の出力を入力とする制御対象と、を備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器のパラメータを算出するコンピュータに、
前記制御器の出力の時系列データである第１時系列データを取得する機能と、
前記制御対象の出力の時系列データである第２時系列データを取得する機能と、
前記制御器のパラメータ、前記第１時系列データ、及び前記第２時系列データから、前記制御器に入力する入力信号の時系列データの推定値である第３時系列データを推定する機能と、
前記第２時系列データと前記第３時系列データとに基づいて、前記制御器に対する相補感度関数を算出する機能と、
前記制御システムの入力信号を前記相補感度関数に印加したときの出力である第４時系列データを算出する機能と、
前記制御対象の入力に対する所定の応答を実現するモデルである参照モデルに前記入力信号を入力した場合の出力の時系列データである第５時系列データを取得する機能と、
前記第４時系列データと前記第５時系列データとの誤差に関する評価関数の評価値に基づいて前記参照モデルのむだ時間であるモデルむだ時間を決定する機能と、
決定した前記モデルむだ時間および前記制御器のパラメータを用いる適正化アルゴリズムを実行することにより前記参照モデルの応答性のパラメータを適正化する機能と、
を実現させるプログラム。