JP7327569B1

JP7327569B1 - 情報処理装置

Info

Publication number: JP7327569B1
Application number: JP2022072556A
Authority: JP
Inventors: 修一矢作
Original assignee: Isuzu Motors Ltd
Current assignee: Isuzu Motors Ltd
Priority date: 2022-04-26
Filing date: 2022-04-26
Publication date: 2023-08-16
Anticipated expiration: 2042-04-26
Also published as: JP2023161913A

Abstract

【課題】複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが可能な情報処理装置を提供する。【解決手段】情報処理装置は、入力信号が入力される制御対象と、目標値と制御対象の出力との差分が入力され、入力信号が出力される制御器と、目標値を入力として制御対象の出力をモデル化する参照モデルと、を備える制御システムにおける情報処理装置であって、制御器は、差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて制御対象を制御し、制御対象の出力と参照モデルの出力との誤差に関する評価関数に基づいて、制御パラメータを算出するパラメータ算出部を備え、評価関数は、制御パラメータを要素とするパラメータベルトルに関して凸関数である。【選択図】図９

Description

本開示は、情報処理装置に関する。

産業システムの閉ループ制御の９０％以上は直感的に理解できるＰＩＤ（Proportional-Integral-Differential）制御が用いられている。線形性の強い制御対象であれば所望の制御性能が得られるが、非線形システムの場合、ゲインが固定されたＰＩＤ制御で十分な制御性能を得ることは難しい。非線形制御理論やモデルベース制御の適用も考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きいため非線形制御適用のハードルが高い。また、産業システムは複雑であり精度の高いモデルを得ることが難しい場合が多く、モデルベース制御の効果が十分に発揮できない場合がある。

近年、システム同定を介することなく制御対象モデルを用いない制御系設計法が注目されている。取得したデータからオフラインで最適制御パラメータを求める手法として、ＶＲＦＴ（Virtual Reference Feedback Tuning）や、ＦＲＩＴ（Fictitious Reference Feedback Tuning ）が提案されている。ＶＲＦＴやＦＲＩＴといった、直接、制御器の同定を行うタイプのデータ駆動制御の他に、ＭＦＡＣ（Model Free Adaptive Control）や、ＭＦＣ（Model Free Control）が提案されている。ＭＦＡＣは動的線形化技術に基づいた手法であり、非線形システムへの適用が可能である。ＭＦＡＣは安定性が理論的に保証されているが、設計パラメータの多さやそれらのリセットタイミングの設定等に試行錯誤を有する。ＭＦＣはウルトラローカルモデル（ultra-local model）に基づいた手法であり、ＭＦＡＣと同様に非線形システムへの適用が可能である。また、ＭＦＣは知的ＰＩＤ（ｉＰＩＤ）制御と呼ばれ、直観的に理解しやすく、産業界にも受け入れやすいと考えられる。以上のような制御対象のモデルを用いない制御手法は、プロセス系や自動車システム等の産業システムへの適用も進められている。

例えば、特許文献１には、入力値を制御対象に入力した場合の制御対象の出力値と、入力信号を参照モデルに入力した場合の参照モデルの出力値との誤差に関する評価関数の評価値に基づいてパラメータを求める方法が記載されている。

特開２０２２－４１６６１号公報

P. Polack, S. Delprat, B d'Andrea Novel, Brake and velocity model free control on an actual vehicle, Control Engineering Practice, 2019 92(8):104072

ところで、上述した通り、ＭＦＣは理解しやすいかつ、非線形システムへ適用可能なことが特徴であるが、その設計パラメータ（αおよびＰＩＤゲイン）は現場での試行錯誤的な調整が行われる。例えば、非特許文献１には、ｉＰ制御における設計パラメータの調整指針が記載され、ｉＰ制御における設計パラメータの調整は従来のＰＩＤ制御器と比較して簡便な調整が可能である。しかしながら、最終的には試行錯誤的なファインチューニングを行っている。また、ｉＰＩＤ制御における設計パラメータの調整指針の記載はない。このような問題に対して、ＭＦＣの設計パラメータをデータ駆動制御のアプローチで自動調整する手法が提案されている。提案手法は有用であるが、ＭＦＣに含まれる設計パラメータ（αおよびＰＩＤゲイン）のすべてを可調整パラメータとして扱っておらず、ＭＦＣの性能に大きく関わるαは既知としてＰＩＤゲインの調整のみを行っている。また、評価関数が調整パラメータに対して凸になっておらず、非線形最適化により設計パラメータを求めている。非線形な評価関数の最適化には多大な計算時間を要することや局所解に陥る可能性があること、最適化ソルバのハイパーパラメータ（任意性パラメータ）の設定が必要になることが課題である。実用上、簡便かつ迅速に設計パラメータを得ることが望まれる。

本開示の目的は、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが可能な情報処理装置を提供することである。

上記の目的を達成するため、本開示における情報処理装置は、
入力信号が入力される制御対象と、
目標値と前記制御対象の出力との差分が入力され、前記入力信号が出力される制御器と、
前記目標値を入力として前記制御対象の出力をモデル化する参照モデルと、
を備える制御システムにおける情報処理装置であって、
前記制御器は、前記差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて前記制御対象を制御し、
前記制御対象の出力と前記参照モデルの出力との誤差に関する評価関数に基づいて、前記制御パラメータを算出するパラメータ算出部を備え、
前記評価関数は、前記制御パラメータを要素とするパラメータベクトルに関して凸関数である。

本開示によれば、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することができる。

図１は、モデルフリー制御方法を用いた制御システムを示す図である。図２は、ＶＲＦＴの説明図である。図３は、クロスバリデーションの説明図である。図４は、開ループ試験で与えた初期の入出力データを示す図である。図５は、入出力データから設計パラメータを最小二乗法で求めたときの時系列データを示す図である。図６は、入出力データから設計パラメータをＲｉｄｇｅ回帰で求めたときの時系列データを示す図である。図７は、古典的なＰＩＤ制御器を用いたときの時系列データを示す図である。図８は、最適化されたパラメータおよび評価関数値を示す図である。図９は、実施の形態に係る情報処理装置の機能構成を模式的に示す図である。図１０は、実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。

以下、本開示の実施の形態について、図面を参照しながら説明する。
図１は、モデルフリー制御方法を用いた制御システムを示す図である。以下の説明で、モデルフリー制御（Model Free Control）を、単に「ＭＦＣ」という。図１に、一点鎖線により囲まれた領域で示されたブロックがＭＦＣアルゴリズムである。

［ＭＦＣの概要］
先ず、ＭＦＣの概要について説明する。
制御対象は式（１）で表現可能な非線形なＳＩＳＯ（single-input single-output）システムとする。

ここで、ｆ（）は未知な非線形関数、ｕは実数集合の元であって、制御入力である。ｙは実数集合の元であって、出力である。ｍ，ｌはそれぞれ入力と出力との未知な次数である。また、ｙ^（ｍ）（ｔ）は、ｙのｔに関するｍ階微分である。ＭＦＣでは、上記の非線形システムをウルトラローカルモデル（ultra-local model）として表す。非線形システムを式（２）に示す。

ここで、ｎ≧１は次数であり、αは実数集合の元であって、設計パラメータである。Ｆは実数集合の元であって、モデル化されていない動特性および外乱を表す。ここでは、ｎ＝１とする。

［ＭＦＣの制御則］
次に、ＭＦＣ制御則について説明する。ウルトラローカルモデルに基づいて導出されるＭＦＣ制御則を図１に示す。ｙ_ｒは、目標値、εは、偏差、Ｐは制御対象である。式（２）により制御則は、式（３）となる。

ここで、

ＦハットはＦの推定値、ε（ｔ）は偏差、δは微少時間を表す。また、ｙ_ｒは、微分可能な信号であり、元の目標値にローパスフィルタ等を通して生成される信号である。Ｋ（ε（ｔ））は、フィードバック制御器であり、ここでは、ＰＩＤ制御則の式（６）を用いる。

ｓはラプラス演算子、Ｋ_ｐ、Ｋ_ｉ、Ｋ_ｄはそれぞれ、比例ゲイン、積分ゲイン、微分ゲインである。ＰＩＤ制御則をラプラス領域で記述すると、式（７）となる。

ここで、

Ｆの推定において、実システムではノイズ除去が必要であるため、フィルタＷ_Ｆを用いると式（１０）となる。

以上により、制御入力は式（１１）で計算される。

式（３）およびブロック線図（図１を参照）より、－α^－１Ｆハット（ｔ）は、外乱オブザーバの役割、α^－１ｙ_ｒドット（ｔ）は、フィードフォワード制御の役割、Ｃ（ε（ｔ））はフィードバック制御の役割に相当する。

［ＭＦＣの安定性解析］
次に、ＭＦＣの安定性解析について説明する。
式（２）に示したプラントモデル（ultra-local model）に式（３）に示した制御則を代入すると式（１２）となる。

実値と推定値との誤差を式（１３）とおくと、

式（１４）の誤差方程式が得られる。

ここで、式（１５）に示すように、推定誤差が有界であるとする。

式（１６）の特性方程式が得られる。

式（１６）がフルビッツの安定条件を満たすとき、システムは安定となる。
ここで、特性方程式がフルビッツの安定条件を満たす場合においても、式（１５）が満たされない場合にはシステムの安定性は保証されない。ディジタル制御器への実装時にはδ→０にはできないため、推定遅れが生じる。サンプリング周期が大きい中、制御入力が大きく変動すると、Ｆの推定値の誤差が増大することで、式（１５）が満たされなくなる可能性がある。

ＭＦＣでは、実験を繰り返すことで設計パラメータを調整する必要がある。本実施の形態では、データ駆動調整のアプローチにより、ＭＦＣの設計パラメータを自動で調整する。図１にＭＦＣによるモデル参照制御のブロック線図を示す。目標値（Set point）ｙ_ｒから出力ｙまでの伝達特性が、設計者が決めた参照モデルＭ_ｄに一致するようなＭＦＣ設計パラメータｗを自動で調整することを考える。

ここで、調整パラメータｗは、ＭＦＣ設計パラメータであるαおよびＰＩＤゲインである。

［ＭＦＣ設計パラメータの自動調整］
次に、データ駆動制御の１つであるＶＲＦＴのアプローチによりＭＦＣ設計パラメータの自動調整法を構築する。

先ず、ＶＲＦＴについて説明する。ＶＲＦＴは、閉ループ系の入出力データからシステム同定を介さずに、直接的に、制御パラメータを求める手法である。目標値(Set point)・ｙ_ｒから出力ｙまでの閉ループ伝達特性が、設計者が決めた参照モデルＭ_ｄに一致するような制御パラメータｗを自動で調整するモデル参照型のデータ駆動制御である。図２にＶＲＦＴの構造について示す。Ｃ、Ｍ_ｄ、Ｐは、それぞれ制御器、参照モデル、制御対象（プラント）であり、ｕ（ｔ）、ｙ（ｔ）は入力と出力である。ρは制御器パラメータである。ｙ_ｒｖ（ｔ）、ｕ_ｖ（ｔ）はそれぞれＶＲＦＴで提案されている仮想参照信号および仮想制御入力である。ＶＲＦＴの手順を簡単に述べる。

ステップ１において、希望する閉ループの参照モデルをＭ_ｄとする。プラントの入出力データをｕ（ｔ）、ｙ（ｔ）、ｔ＝１，…，Ｎとする。

ステップ２において、y（t）を参照モデルＭ_ｄの出力とみなすと、ｙ（ｔ）を発生する仮想の参照入力は式（１８）のように決められる。

ステップ３において、この信号を図１の閉ループの参照入力と考える。このとき、コントローラで作られる仮想操作量は、式（１９）になる。

ステップ４において、この仮想操作量と操作量のデータが近づけば，コントローラをもつ閉ループは参照モデルＭ_ｄに近いとみなせる。すなわち、最小化する評価関数は式（２０）となる。

仮想制御入力を式（２０）に代入すると、式（２１）が得られる。

ここで、

ステップ５において、プレフィルタＬの導入
式（２１）の項には、参照モデルＭ_ｄの逆行列がありノンプロパーである。プレフィルタの追加により、ノンプロパーであることを回避する。プレフィルタを式（２１）に追加すると式（２３）が得られる。

ここで、

［評価関数の導出］
ＭＦＣに関する仮想制御入力を式（１１）から求めると式（２５）となる。

求めた仮想制御入力を用いて、ＭＦＣのためのＶＲＦＴに関する評価関数は式（２６）となる。

ここで、

評価関数は制御パラメータベクトルｗに関して凸関数であるので、最小二乗法（LS: Least square)を用いると、最適解ｗ^＊は、式（３０）で求められる。

ここで、

［Ｒｉｄｇｅ回帰によるパラメータの自動調整法］
Ｒｉｄｇｅ回帰とは、過学習を抑えるための正則化手法の１つであり、パラメータの大きさを制御する。機械学習の分野では過適合を防ぎつつ、モデルの予測誤差を小さくするために用いられる。ここでは、式（２３）の最適解を求めるにあたり、Ｒｉｄｇｅ回帰を適用する。これにより、重み係数の過適合の抑制を行い、過剰に制御入力が大きくなることを抑制しシステムの不安定化を防ぐことが期待できる。式（２６）にＬ_２正則化を追加した評価関数は式（３３）となる。

ここで、ｄｉａｇ（）は対角行列を表す。λは正の定数であり、正則化項と誤差の二乗和の項との間の相対的な強さを調整するパラメータである。λの値を変えることで過学習の抑制度合いを調整することが可能になる。Ｒｉｄｇｅ回帰の解析解は式（３５）で得られる。

ここでは、最適な正則化パラメータλを決めるためにクロスバリデーション（交差検証法）を利用する。

クロスバリデーションについて図３を用いて簡単に説明する。
１．データ（例えば、Ｎ個の入出力データ）を、ｋ個のブロックに分ける。これを分割（fold）という。
２．最初の分割１(fold 1)を、ｔｅｓｔｓｅｔ、残りの分割２～５（fold 2-5）をｔｒａｉｎｉｎｇｓｅｔとし、モデルＭ_ｄの学習と評価を行う。
３．分割２(fold 2)をｔｅｓｔｓｅｔ、残りの分割１，３～５（fold 1,fold 3-5）をｔｒａｉｎｉｎｇｓｅｔとして、モデルＭ_ｄの学習と評価を行う。
４．この過程を、分割３，４，５（fold 3,4,5）をｔｅｓｔｓｅｔとして繰り返す。
得られたｋ個の精度の平均値をモデルＭ_ｄの評価値Ｊとする。
設計者が設定したいくつかのλに対してクロスバリデーションを行い、各λに対する評価値Ｊを求めることで、最も評価値が小さくなる最適なλと最適パラメータを得る。
ここで、式（３４）において、λの逆数を採っている理由について説明する。
ＭＦＣの制御則から、αの値が大きいほうが制御入力は小さくなる。すなわち、より安定度が高まる。一方で、ＶＲＦＴにて直接調整する値はα^－１であるため過学習の抑制効果を高めるにはα^－１を大きくする必要がある。これより、α^－１に関する部分においては、λの逆数をとっている。

［アルゴリズム］
次に、ＭＦＣの設計パラメータの自動調整法のアルゴリズムについて説明する。
ステップ１で、開ループ系で入出力データを計測する。
ステップ２で、参照モデルを設定する。
ステップ３で、プレフィルタを設定する。
ステップ４で、評価関数を最小にする重み係数（ＭＦＣ設計パラメータ）をＲｉｄｇｅ回帰で求める。

ステップ３で使用するプレフィルタは、式（３６）を用いる。

ＶＲＦＴによりＭＦＣの設計パラメータの自動調整法が提案されている。しかし、式（７）が再帰的な方程式であるため非線形関数として扱い、ＶＲＦＴの評価関数も非線形としている。ゆえに、高い計算コストを有することや、最適化ソルバに関するハイパーパラメータの設定が必要なこと、解が一意に定まらないことが課題となる。一方、本実施の形態では、最適パラメータを凸解析で求めることができるため、解が一意に定まることや、最適化時間が大幅に短縮することができ、実用上有用であるといえる。さらに、Ｒｉｄｇｅ回帰によるパラメータ調整法を構築したことにより、過学習の抑制が可能になる。

また、ｉＰ制御に関する手動調整指針として、ＰＩＤゲインを０とした状態で、αを徐々に小さくしていきオーバシュートの発生しない値に設定した後、ＰＩＤゲインを調整することが提案されている。しかしながら、ファイン調整が必要となっていることからα含めたＭＦＣパラメータの自動調整が重要であることがわかる。

また、ＭＦＣパラメータの自動調整法が提案されている。しかし、αを既知と仮定し、ＰＩゲインのみを調整パラメータとしていた。一方、ここでは、上記の提案では扱っていなかったαを含めた設計パラメータを調整することが可能である。

［シミュレーション検証］
非線形システムを記述するモデルとして広く用いられているHammersteinモデルを制御対象とする。ここでは、離散システムで用いる。ここでは、零次ホールドにて離散化を行う。

先ず、システム定式化について説明する。制御器を含めたシミュレーションのサンプリング周期は１ｓとし、式（３７）に示すようなHammersteinモデルを制御対象とする。

ｖは、白色雑音である。各時刻の目標値を式（３８）のように設定した。

参照モデルＭ_ｄは式（３９）を用いる。

次に、試験および検討について説明する。
標準ＶＲＦＴでは開ループ試験が推奨されているが、実システムにおいて開ループ試験を行うことが難しい場合がある。したがって、初期入出力データを開ループ試験および閉ループ試験を行ったそれぞれの場合におけるシミュレーションを検討する。さらに、ノズルのない理想的なケースとノズルのあるケースについて検討を行う。

［閉ループ試験データの利用］
ノズルがない理想的な状況での検討を行った。ｖは分散０の白色雑音とした。閉ループ試験で与えた初期の入出力データを図４に示す。設定値は矩形波のランダム信号（最小値－１、最大値５）を印加し、入出力データを計測した。この入出力データからＭＦＣの設計パラメータ（αおよびＰＩＤ）を最小二乗法（MFC-VRFT-LS）およびＲｉｄｇｅ回帰（MFC-VRFT-Ridge）で時系列データを求めた。求めたときの時系列データをそれぞれ、図５および図６に示す。比較のため、古典的なＰＩＤ制御器を用いたときの時系列データを図７に示す。ＰＩＤゲイン（Ｋ_ｐ＝０．０５９、Ｋ_ｉ＝０．０５８、Ｋ_ｄ＝０．００３８）は古典的に有名なＣＨＲ法により得た。これらの図に関して、上段が出力、下段が入力を示す。最小二乗法（MFC-VRFT-LS）を用いた時には、システムが発散した。これは過学習によるものであると考えられる。一方で、Ｒｉｄｇｅ回帰（MFC-VRFT-Ridge）を用いた場合には、目標応答に追従していることが確認できた。また、ＣＨＲよりも高い制御性能が得られていた。図８に示すテーブルに最適化されたパラメータをおよび評価関数値示す。Ｒｉｄｇｅ回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なＭＦＣパラメータが得られたといえる。

次に、ノイズがある状況での検討を行った。ｖは分散１×１０^－３の白色雑音とした。設定値は矩形波のランダム信号（最小値－１、最大値５）を印加し、入出力データを計測した。この入出力データからＭＦＣの設計パラメータ（αおよびＰＩＤゲイン)を最小二乗法（MFC-VRFT-LS）およびＲｉｄｇｅ回帰（MFC-VRFT-Ridge）で時系列データを求めた。求めたときの時系列データの図を省略する。最小二乗法（MFC-VRFT-LS）を用いた時には、システムが発散している。これは過学習によるものであると考えられる。一方で、Ｒｉｄｇｅ回帰（MFC-VRFT-Ridge）を用いた場合には、目標応答に追従していることが確認できた。さらに、古典的に有名なＣＨＲ法と比較して高い応答性が得られている。パラメータおよび評価関数値を最適化した。最適化されたパラメータおよび評価関数値を示すテーブルを省略する。Ｒｉｄｇｅ回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なＭＦＣパラメータが得られたといえる。

［開ループ試験データの利用］
ノズルがない理想的な状況での検討を行った。ｖは分散０の白色雑音とした。開ループ試験で与えた初期の入出力データを省略する。入力はチャープサイン信号を印加し、そのときの入出力データを計測した。この入出力データからＭＦＣの設計パラメータ(αおよびＰＩＤゲイン)を最小二乗法（MFC-VRFT-LS）およびＲｉｄｇｅ回帰（MFC-VRFT-Ridge）で時系列データを求めた。求めたときの時系列データを省略する。

本実施の形態の手法は、ＣＨＲ法と比較して高い応答性が得られていることが確認できた。Ｒｉｄｇｅ回帰（MFC-VRFT-Ridge）の場合には、最小二乗法（MFC-VRFT-LS）のときと比較し、オーバシュートが少なくなっていた。これは過学習が抑制された結果、制御入力の変動も小さくなったためである。パラメータおよび評価関数値を最適化した。最適化されたパラメータおよび評価関数値を省略する。Ｒｉｄｇｅ回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なＭＦＣパラメータが得られたといえる。

次に、ノイズがある状況での検討を行った。ｖは分散1×１０^－３の白色雑音とした。入力はチャープサイン信号を印加し、入出力データを計測した。この入出力データからＭＦＣの設計パラメータ(αおよびＰＩＤゲイン)を最小二乗法（MFC-VRFT-LS）およびＲｉｄｇｅ回帰（MFC-VRFT-Ridge）で時系列データを求めた。求めたときの時系列データを省略する。本実施の形態の手法は、ＣＨＲ法と比較して高い応答性が得られていることが確認できた。Ｒｉｄｇｅ回帰（MFC-VRFT-Ridge）の場合には、最小二乗法（MFC-VRFT-LS）のときと比較し、オーバシュートが少なくなっている。これは過学習が抑制された結果、制御入力の変動も小さくなったためである。Ｒｉｄｇｅ回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっている。このことから、過学習が抑制され、より安定なＭＦＣパラメータが得られたといえる。これらの傾向はノイズがない理想的な条件と同等の結果である。

［試験の結論］
開ループ試験データと閉ループ試験において、ノイズの有無による最適化された制御パラメータの変動は小さいことを確認した。また、Ｒｉｄｇｅ回帰を用いることで、過学習の抑制を可能にした。開ループ試験データを用いたときには、オーバシュートを抑制し、閉ループ試験データを用いた時には、システムの不安定化を避けることができることを確認した。開ループ試験および閉ループ試験データを用いて最適化されたパラメータの値には若干の違いがみられた。これは、入出力データの違いによると考えられる。ここでは、ＳＩＳＯシステムに限定したが、ＭＩＭＯシステムへ拡張することもできる。

＜実施の形態に係る情報処理装置１の機能構成＞
以上の技術を前提として、実施の形態に係る情報処理装置１を説明する。

図１は、実施の形態に係る閉ループ系を模式的に示す図であり、システム同定を介することなく制御対象モデルを用いずに、取得したデータからオフラインで最適制御パラメータを求めるための構成を示す図である。図１に示すように、実施の形態に係る情報処理装置１は、制御対象Ｐの入出力を取得し、制御対象Ｐの特性を推定し、参照モデルＭ_ｄを設定し、プレフィルタ（式（２３）を参照）を設定して、評価関数を導出するとともに、制御器Ｃの制御パラメータを出力する。なお、実施の形態に係る閉ループ系は、参照モデルＭ_ｄを備える一般的な閉ループ系に情報処理装置１が追加されて構成されている。

図９は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図９において、矢印は主なデータの流れを示しており、図９に示していないデータの流れがあってもよい。図９において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図９に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報などを格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによって特性推定部３０、評価関数導出部３１、及びパラメータ算出部３２として機能する。

なお、図９は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

実施の形態に係る情報処理装置１は、図９における制御器Ｃの制御パラメータを算出する。すなわち、情報処理装置１は、入力信号が入力される制御対象Ｐと、目標値と制御対象Ｐの出力との差分が入力され、上記の入力信号が出力される制御器Ｃと、目標値を入力として制御対象Ｐの出力をモデル化する参照モデルＭ_ｄを備える制御システムにおける情報処理装置であって、制御器Ｃの制御パラメータを算出するパラメータ算出部３２を備える。

制御器Ｃは、差分および当該差分に対応するパラメータ（フィードバック制御の設計パラメータ）、目標値および当該目標値に対応するパラメータ（フィードフォワード制御の設計パラメータ）、並びに、外乱および動特性を含む制御対象Ｐの特性および当該特性に対応するパラメータを含む制御パラメータに基づいて制御対象Ｐを制御する。

特性推定部３０は、フィルタＷ_Ｆを用いて、制御対象Ｐの特性を推定する（式（１０）を参照）。制御対象Ｐの特性とは、外乱および動特性を含む制御対象Ｐの特性である。外乱は、制御対象Ｐに加わる外乱である。動特性は、制御対象Ｐが有する例えば固有振動数や減衰特性などである。特性推定部３０により推定された制御対象Ｐの特性の推定値Ｆハットは、評価関数導出部３１により用いられる。

評価関数導出部３１は、制御対象Ｐの特性の実値Ｆ（ｔ）、制御対象Ｐの特性の推定値Ｆハット（ｔ）、制御対象Ｐの入力ｕ（ｔ）、出力ｙ^（ｎ）（ｔ）（式（２）を参照）、および、ｙ（ｔ）を参照モデルＭ_ｄの出力とみなした場合の参照モデルＭ_ｄの仮想の参照入力Ｍ_ｄ ^-1ｙ（ｔ）（式（１８）を参照）、目標値ｙ_ｒから出力ｙまでの伝達特性が参照モデルＭ_ｄに一致する場合の参照モデルＭ_ｄの出力Ｍ_ｄｙ_ｒ（ｔ）（式（１７）を参照）に基づいて評価関数を導出する。以上のように導出された評価関数を式（２６）および式（３３）のそれぞれに示す。評価関数は、制御パラメータを要素とするパラメータベクトルｗ（式（２８）を参照）に関して凸関数である。

パラメータ算出部３２は、評価関数を最小にすることで、制御器Ｃの制御パラメータを算出する。具体的には、パラメータ算出部３２は、評価関数を最適化する。評価関数を最適化する場合においては、評価関数が凸関数であるため、最小二乗法又はＲｉｄｇｅ回帰を用いることが可能となる。式（２６）に示す評価関数が最小二乗法を用いる場合の評価関数である。また、式（３３）に示す評価関数がＲｉｄｇｅ回帰を用いる場合の評価関数である。なお、評価関数を最適化する場合、最小二乗法や、Ｒｉｄｇｅ回帰の他に、Ｌａｓｓｏ回帰又はエラステックネット（Elastic Net）を用いてもよい。

＜情報処理装置１が実行する情報処理の処理フロー＞
図１０は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

図１０に示すように、先ず、特性推定部３０は、フィルタＷ_Ｆを用いて、制御対象Ｐの特性を推定する（Ｓ１）。

次に、評価関数導出部３１は、特性推定得部３０が推定した制御対象Ｐの特性の推定値Ｆハット、制御対象Ｐの特性の実値Ｆ、制御対象Ｐの入出力データ、および、参照モデルＭ_ｄの入出力データに基づいて、評価関数を導出する（Ｓ２）。

次に、パラメータ算出部３２は、評価関数を最小にすることで、ＭＦＣに含まれる設計パラメータを算出する（Ｓ３）。その後、図１０に示すフローは終了する。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、ＭＦＣを用いる。これにより、複雑な特性をもつ産業システムに対する制御性能を確保することが可能となる。また、ＭＦＣおよびＶＲＦＴを用いることで、1組の実験データから、最適なＭＦＣ設計パラメータが求められる。すなわち、実験を繰り返し行うような繰り返しの手動調整が必要ないため、制御対象の数式モデルが得られない場合でも制御性能を発揮することが可能となる。また、ＭＦＣの設計パラメータの自動調整を実現するＶＲＦＴの評価関数を凸関数になるように導出する。これにより、非線形最適化が必要なく、短時間で最適パラメータが得られるため、時間・人的コストを低減することが可能となる。

パラメータ算出部３２は、評価関数を最小にする制御パラメータを算出する場合、Ｒｉｄｇｅ回帰を用いる。これにより、過学習を防ぐことが可能となる。また、一般にＲｉｄｇｅ回帰はハイパーパラメータを自動で決定し、ハイパーパラメータの設定が必要ないことから、簡便な自動調整が可能になる。

制御器Ｃは制御パラメータに基づいて制御対象Ｐを制御する。制御パラメータは、差分および当該差分に対するパラメータ（フィードバック制御における制御パラメータ）、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む。さらに、制御パラメータは、目標値および当該目標値に対するパラメータ（フィードフォワード制御における制御パラメータ）を含む。これにより、ＭＦＣに含まれる設計パラメータ（αおよびＰＩＤゲイン）のすべてを、制御対象Ｐの入出力データからシステム同定を介することなく自動調整可能なパラメータとして扱うことが可能となる。

その他、上記実施の形態は、何れも本開示の実施をするにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

本開示は、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが要求される情報処理装置を備える制御システムに好適に利用される。

１情報処理装置
２記憶部
３制御部
３０特性推定部
３１評価関数導出部
３２パラメータ算出部

Claims

入力信号が入力される制御対象と、
目標値と前記制御対象の出力との差分が入力され、前記入力信号が出力される制御器と、
前記目標値を入力として前記制御対象の出力をモデル化する参照モデルと、
を備える制御システムにおける情報処理装置であって、
前記制御器は、前記差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて前記制御対象を制御し、
前記制御対象の出力と前記参照モデルの出力との誤差に関する評価関数に基づいて、前記制御パラメータを算出するパラメータ算出部を備え、
前記評価関数は、前記制御パラメータを要素とするパラメータベクトルに関して凸関数である、
情報処理装置。
前記パラメータ算出部は、前記評価関数を最小にすることで前記制御パラメータを算出する、
請求項１に記載の情報処理装置。
前記パラメータ算出部は、前記評価関数を最小にする前記制御パラメータを算出する場合、Ｒｉｄｇｅ回帰を用いる、
請求項２に記載の情報処理装置。
前記パラメータ算出部は、前記評価関数に基づいて前記制御パラメータを算出する場合、最小二乗法を用いる、
請求項２に記載の情報処理装置。
前記制御パラメータは、前記目標値および当該目標値に対するパラメータを含む、
請求項１から４の何れか一項に記載の情報処理装置。