JP7327569B1 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP7327569B1 JP7327569B1 JP2022072556A JP2022072556A JP7327569B1 JP 7327569 B1 JP7327569 B1 JP 7327569B1 JP 2022072556 A JP2022072556 A JP 2022072556A JP 2022072556 A JP2022072556 A JP 2022072556A JP 7327569 B1 JP7327569 B1 JP 7327569B1
- Authority
- JP
- Japan
- Prior art keywords
- control
- input
- controlled object
- output
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
【課題】複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが可能な情報処理装置を提供する。【解決手段】情報処理装置は、入力信号が入力される制御対象と、目標値と制御対象の出力との差分が入力され、入力信号が出力される制御器と、目標値を入力として制御対象の出力をモデル化する参照モデルと、を備える制御システムにおける情報処理装置であって、制御器は、差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて制御対象を制御し、制御対象の出力と参照モデルの出力との誤差に関する評価関数に基づいて、制御パラメータを算出するパラメータ算出部を備え、評価関数は、制御パラメータを要素とするパラメータベルトルに関して凸関数である。【選択図】図9
Description
本開示は、情報処理装置に関する。
産業システムの閉ループ制御の90%以上は直感的に理解できるPID(Proportional-Integral-Differential)制御が用いられている。線形性の強い制御対象であれば所望の制御性能が得られるが、非線形システムの場合、ゲインが固定されたPID制御で十分な制御性能を得ることは難しい。非線形制御理論やモデルベース制御の適用も考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きいため非線形制御適用のハードルが高い。また、産業システムは複雑であり精度の高いモデルを得ることが難しい場合が多く、モデルベース制御の効果が十分に発揮できない場合がある。
近年、システム同定を介することなく制御対象モデルを用いない制御系設計法が注目されている。取得したデータからオフラインで最適制御パラメータを求める手法として、VRFT(Virtual Reference Feedback Tuning)や、FRIT(Fictitious Reference Feedback Tuning )が提案されている。VRFTやFRITといった、直接、制御器の同定を行うタイプのデータ駆動制御の他に、MFAC(Model Free Adaptive Control)や、MFC(Model Free Control)が提案されている。MFACは動的線形化技術に基づいた手法であり、非線形システムへの適用が可能である。MFACは安定性が理論的に保証されているが、設計パラメータの多さやそれらのリセットタイミングの設定等に試行錯誤を有する。MFCはウルトラローカルモデル(ultra-local model)に基づいた手法であり、MFACと同様に非線形システムへの適用が可能である。また、MFCは知的PID(iPID)制御と呼ばれ、直観的に理解しやすく、産業界にも受け入れやすいと考えられる。以上のような制御対象のモデルを用いない制御手法は、プロセス系や自動車システム等の産業システムへの適用も進められている。
例えば、特許文献1には、入力値を制御対象に入力した場合の制御対象の出力値と、入力信号を参照モデルに入力した場合の参照モデルの出力値との誤差に関する評価関数の評価値に基づいてパラメータを求める方法が記載されている。
P. Polack, S. Delprat, B d'Andrea Novel, Brake and velocity model free control on an actual vehicle, Control Engineering Practice, 2019 92(8):104072
ところで、上述した通り、MFCは理解しやすいかつ、非線形システムへ適用可能なことが特徴であるが、その設計パラメータ(αおよびPIDゲイン)は現場での試行錯誤的な調整が行われる。例えば、非特許文献1には、iP制御における設計パラメータの調整指針が記載され、iP制御における設計パラメータの調整は従来のPID制御器と比較して簡便な調整が可能である。しかしながら、最終的には試行錯誤的なファインチューニングを行っている。また、iPID制御における設計パラメータの調整指針の記載はない。このような問題に対して、MFCの設計パラメータをデータ駆動制御のアプローチで自動調整する手法が提案されている。提案手法は有用であるが、MFCに含まれる設計パラメータ(αおよびPIDゲイン)のすべてを可調整パラメータとして扱っておらず、MFCの性能に大きく関わるαは既知としてPIDゲインの調整のみを行っている。また、評価関数が調整パラメータに対して凸になっておらず、非線形最適化により設計パラメータを求めている。非線形な評価関数の最適化には多大な計算時間を要することや局所解に陥る可能性があること、最適化ソルバのハイパーパラメータ(任意性パラメータ)の設定が必要になることが課題である。実用上、簡便かつ迅速に設計パラメータを得ることが望まれる。
本開示の目的は、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが可能な情報処理装置を提供することである。
上記の目的を達成するため、本開示における情報処理装置は、
入力信号が入力される制御対象と、
目標値と前記制御対象の出力との差分が入力され、前記入力信号が出力される制御器と、
前記目標値を入力として前記制御対象の出力をモデル化する参照モデルと、
を備える制御システムにおける情報処理装置であって、
前記制御器は、前記差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて前記制御対象を制御し、
前記制御対象の出力と前記参照モデルの出力との誤差に関する評価関数に基づいて、前記制御パラメータを算出するパラメータ算出部を備え、
前記評価関数は、前記制御パラメータを要素とするパラメータベクトルに関して凸関数である。
入力信号が入力される制御対象と、
目標値と前記制御対象の出力との差分が入力され、前記入力信号が出力される制御器と、
前記目標値を入力として前記制御対象の出力をモデル化する参照モデルと、
を備える制御システムにおける情報処理装置であって、
前記制御器は、前記差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて前記制御対象を制御し、
前記制御対象の出力と前記参照モデルの出力との誤差に関する評価関数に基づいて、前記制御パラメータを算出するパラメータ算出部を備え、
前記評価関数は、前記制御パラメータを要素とするパラメータベクトルに関して凸関数である。
本開示によれば、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することができる。
以下、本開示の実施の形態について、図面を参照しながら説明する。
図1は、モデルフリー制御方法を用いた制御システムを示す図である。以下の説明で、モデルフリー制御(Model Free Control)を、単に「MFC」という。図1に、一点鎖線により囲まれた領域で示されたブロックがMFCアルゴリズムである。
図1は、モデルフリー制御方法を用いた制御システムを示す図である。以下の説明で、モデルフリー制御(Model Free Control)を、単に「MFC」という。図1に、一点鎖線により囲まれた領域で示されたブロックがMFCアルゴリズムである。
[MFCの概要]
先ず、MFCの概要について説明する。
制御対象は式(1)で表現可能な非線形なSISO(single-input single-output)システムとする。
ここで、f()は未知な非線形関数、uは実数集合の元であって、制御入力である。yは実数集合の元であって、出力である。m,lはそれぞれ入力と出力との未知な次数である。また、y(m)(t)は、yのtに関するm階微分である。MFCでは、上記の非線形システムをウルトラローカルモデル(ultra-local model)として表す。非線形システムを式(2)に示す。
ここで、n≧1は次数であり、αは実数集合の元であって、設計パラメータである。Fは実数集合の元であって、モデル化されていない動特性および外乱を表す。ここでは、n=1とする。
先ず、MFCの概要について説明する。
制御対象は式(1)で表現可能な非線形なSISO(single-input single-output)システムとする。
ここで、f()は未知な非線形関数、uは実数集合の元であって、制御入力である。yは実数集合の元であって、出力である。m,lはそれぞれ入力と出力との未知な次数である。また、y(m)(t)は、yのtに関するm階微分である。MFCでは、上記の非線形システムをウルトラローカルモデル(ultra-local model)として表す。非線形システムを式(2)に示す。
ここで、n≧1は次数であり、αは実数集合の元であって、設計パラメータである。Fは実数集合の元であって、モデル化されていない動特性および外乱を表す。ここでは、n=1とする。
[MFCの制御則]
次に、MFC制御則について説明する。ウルトラローカルモデルに基づいて導出されるMFC制御則を図1に示す。yrは、目標値、εは、偏差、Pは制御対象である。式(2)により制御則は、式(3)となる。
ここで、
次に、MFC制御則について説明する。ウルトラローカルモデルに基づいて導出されるMFC制御則を図1に示す。yrは、目標値、εは、偏差、Pは制御対象である。式(2)により制御則は、式(3)となる。
ここで、
FハットはFの推定値、ε(t)は偏差、δは微少時間を表す。また、yrは、微分可能な信号であり、元の目標値にローパスフィルタ等を通して生成される信号である。K(ε(t))は、フィードバック制御器であり、ここでは、PID制御則の式(6)を用いる。
sはラプラス演算子、Kp、Ki、Kdはそれぞれ、比例ゲイン、積分ゲイン、微分ゲインである。PID制御則をラプラス領域で記述すると、式(7)となる。
ここで、
sはラプラス演算子、Kp、Ki、Kdはそれぞれ、比例ゲイン、積分ゲイン、微分ゲインである。PID制御則をラプラス領域で記述すると、式(7)となる。
ここで、
式(3)およびブロック線図(図1を参照)より、-α-1Fハット(t)は、外乱オブザーバの役割、α-1yrドット(t)は、フィードフォワード制御の役割、C(ε(t))はフィードバック制御の役割に相当する。
[MFCの安定性解析]
次に、MFCの安定性解析について説明する。
式(2)に示したプラントモデル(ultra-local model)に式(3)に示した制御則を代入すると式(12)となる。
実値と推定値との誤差を式(13)とおくと、
式(14)の誤差方程式が得られる。
次に、MFCの安定性解析について説明する。
式(2)に示したプラントモデル(ultra-local model)に式(3)に示した制御則を代入すると式(12)となる。
実値と推定値との誤差を式(13)とおくと、
式(14)の誤差方程式が得られる。
ここで、式(15)に示すように、推定誤差が有界であるとする。
式(16)の特性方程式が得られる。
式(16)がフルビッツの安定条件を満たすとき、システムは安定となる。
ここで、特性方程式がフルビッツの安定条件を満たす場合においても、式(15)が満たされない場合にはシステムの安定性は保証されない。ディジタル制御器への実装時にはδ→0にはできないため、推定遅れが生じる。サンプリング周期が大きい中、制御入力が大きく変動すると、Fの推定値の誤差が増大することで、式(15)が満たされなくなる可能性がある。
式(16)の特性方程式が得られる。
式(16)がフルビッツの安定条件を満たすとき、システムは安定となる。
ここで、特性方程式がフルビッツの安定条件を満たす場合においても、式(15)が満たされない場合にはシステムの安定性は保証されない。ディジタル制御器への実装時にはδ→0にはできないため、推定遅れが生じる。サンプリング周期が大きい中、制御入力が大きく変動すると、Fの推定値の誤差が増大することで、式(15)が満たされなくなる可能性がある。
MFCでは、実験を繰り返すことで設計パラメータを調整する必要がある。本実施の形態では、データ駆動調整のアプローチにより、MFCの設計パラメータを自動で調整する。図1にMFCによるモデル参照制御のブロック線図を示す。目標値(Set point)yrから出力yまでの伝達特性が、設計者が決めた参照モデルMdに一致するようなMFC設計パラメータwを自動で調整することを考える。
[MFC設計パラメータの自動調整]
次に、データ駆動制御の1つであるVRFTのアプローチによりMFC設計パラメータの自動調整法を構築する。
次に、データ駆動制御の1つであるVRFTのアプローチによりMFC設計パラメータの自動調整法を構築する。
先ず、VRFTについて説明する。VRFTは、閉ループ系の入出力データからシステム同定を介さずに、直接的に、制御パラメータを求める手法である。目標値(Set point)・yrから出力yまでの閉ループ伝達特性が、設計者が決めた参照モデルMdに一致するような制御パラメータwを自動で調整するモデル参照型のデータ駆動制御である。図2にVRFTの構造について示す。C、Md、Pは、それぞれ制御器、参照モデル、制御対象(プラント)であり、u(t)、y(t)は入力と出力である。ρは制御器パラメータである。yrv(t)、uv(t)はそれぞれVRFTで提案されている仮想参照信号および仮想制御入力である。VRFTの手順を簡単に述べる。
ステップ1において、希望する閉ループの参照モデルをMdとする。プラントの入出力データをu(t)、y(t)、t=1,…,Nとする。
ステップ5において、プレフィルタLの導入
式(21)の項には、参照モデルMdの逆行列がありノンプロパーである。プレフィルタの追加により、ノンプロパーであることを回避する。プレフィルタを式(21)に追加すると式(23)が得られる。
ここで、
式(21)の項には、参照モデルMdの逆行列がありノンプロパーである。プレフィルタの追加により、ノンプロパーであることを回避する。プレフィルタを式(21)に追加すると式(23)が得られる。
ここで、
[Ridge回帰によるパラメータの自動調整法]
Ridge回帰とは、過学習を抑えるための正則化手法の1つであり、パラメータの大きさを制御する。機械学習の分野では過適合を防ぎつつ、モデルの予測誤差を小さくするために用いられる。ここでは、式(23)の最適解を求めるにあたり、Ridge回帰を適用する。これにより、重み係数の過適合の抑制を行い、過剰に制御入力が大きくなることを抑制しシステムの不安定化を防ぐことが期待できる。式(26)にL2正則化を追加した評価関数は式(33)となる。
ここで、diag()は対角行列を表す。λは正の定数であり、正則化項と誤差の二乗和の項との間の相対的な強さを調整するパラメータである。λの値を変えることで過学習の抑制度合いを調整することが可能になる。Ridge回帰の解析解は式(35)で得られる。
ここでは、最適な正則化パラメータλを決めるためにクロスバリデーション(交差検証法)を利用する。
Ridge回帰とは、過学習を抑えるための正則化手法の1つであり、パラメータの大きさを制御する。機械学習の分野では過適合を防ぎつつ、モデルの予測誤差を小さくするために用いられる。ここでは、式(23)の最適解を求めるにあたり、Ridge回帰を適用する。これにより、重み係数の過適合の抑制を行い、過剰に制御入力が大きくなることを抑制しシステムの不安定化を防ぐことが期待できる。式(26)にL2正則化を追加した評価関数は式(33)となる。
ここで、diag()は対角行列を表す。λは正の定数であり、正則化項と誤差の二乗和の項との間の相対的な強さを調整するパラメータである。λの値を変えることで過学習の抑制度合いを調整することが可能になる。Ridge回帰の解析解は式(35)で得られる。
ここでは、最適な正則化パラメータλを決めるためにクロスバリデーション(交差検証法)を利用する。
クロスバリデーションについて図3を用いて簡単に説明する。
1.データ(例えば、N個の入出力データ)を、k個のブロックに分ける。これを分割(fold)という。
2.最初の分割1(fold 1)を、test set、残りの分割2~5(fold 2-5)をtraining setとし、モデルMdの学習と評価を行う。
3.分割2(fold 2)をtest set、残りの分割1,3~5(fold 1,fold 3-5)をtraining setとして、モデルMdの学習と評価を行う。
4.この過程を、分割3,4,5(fold 3,4,5)をtest setとして繰り返す。
得られたk個の精度の平均値をモデルMdの評価値Jとする。
設計者が設定したいくつかのλに対してクロスバリデーションを行い、各λに対する評価値Jを求めることで、最も評価値が小さくなる最適なλと最適パラメータを得る。
ここで、式(34)において、λの逆数を採っている理由について説明する。
MFCの制御則から、αの値が大きいほうが制御入力は小さくなる。すなわち、より安定度が高まる。一方で、VRFTにて直接調整する値はα-1であるため過学習の抑制効果を高めるにはα-1を大きくする必要がある。これより、α-1に関する部分においては、λの逆数をとっている。
1.データ(例えば、N個の入出力データ)を、k個のブロックに分ける。これを分割(fold)という。
2.最初の分割1(fold 1)を、test set、残りの分割2~5(fold 2-5)をtraining setとし、モデルMdの学習と評価を行う。
3.分割2(fold 2)をtest set、残りの分割1,3~5(fold 1,fold 3-5)をtraining setとして、モデルMdの学習と評価を行う。
4.この過程を、分割3,4,5(fold 3,4,5)をtest setとして繰り返す。
得られたk個の精度の平均値をモデルMdの評価値Jとする。
設計者が設定したいくつかのλに対してクロスバリデーションを行い、各λに対する評価値Jを求めることで、最も評価値が小さくなる最適なλと最適パラメータを得る。
ここで、式(34)において、λの逆数を採っている理由について説明する。
MFCの制御則から、αの値が大きいほうが制御入力は小さくなる。すなわち、より安定度が高まる。一方で、VRFTにて直接調整する値はα-1であるため過学習の抑制効果を高めるにはα-1を大きくする必要がある。これより、α-1に関する部分においては、λの逆数をとっている。
[アルゴリズム]
次に、MFCの設計パラメータの自動調整法のアルゴリズムについて説明する。
ステップ1で、開ループ系で入出力データを計測する。
ステップ2で、参照モデルを設定する。
ステップ3で、プレフィルタを設定する。
ステップ4で、評価関数を最小にする重み係数(MFC設計パラメータ)をRidge回帰で求める。
次に、MFCの設計パラメータの自動調整法のアルゴリズムについて説明する。
ステップ1で、開ループ系で入出力データを計測する。
ステップ2で、参照モデルを設定する。
ステップ3で、プレフィルタを設定する。
ステップ4で、評価関数を最小にする重み係数(MFC設計パラメータ)をRidge回帰で求める。
VRFTによりMFCの設計パラメータの自動調整法が提案されている。しかし、式(7)が再帰的な方程式であるため非線形関数として扱い、VRFTの評価関数も非線形としている。ゆえに、高い計算コストを有することや、最適化ソルバに関するハイパーパラメータの設定が必要なこと、解が一意に定まらないことが課題となる。一方、本実施の形態では、最適パラメータを凸解析で求めることができるため、解が一意に定まることや、最適化時間が大幅に短縮することができ、実用上有用であるといえる。さらに、Ridge回帰によるパラメータ調整法を構築したことにより、過学習の抑制が可能になる。
また、iP制御に関する手動調整指針として、PIDゲインを0とした状態で、αを徐々に小さくしていきオーバシュートの発生しない値に設定した後、PIDゲインを調整することが提案されている。しかしながら、ファイン調整が必要となっていることからα含めたMFCパラメータの自動調整が重要であることがわかる。
また、MFCパラメータの自動調整法が提案されている。しかし、αを既知と仮定し、PIゲインのみを調整パラメータとしていた。一方、ここでは、上記の提案では扱っていなかったαを含めた設計パラメータを調整することが可能である。
[シミュレーション検証]
非線形システムを記述するモデルとして広く用いられているHammersteinモデルを制御対象とする。ここでは、離散システムで用いる。ここでは、零次ホールドにて離散化を行う。
非線形システムを記述するモデルとして広く用いられているHammersteinモデルを制御対象とする。ここでは、離散システムで用いる。ここでは、零次ホールドにて離散化を行う。
次に、試験および検討について説明する。
標準VRFTでは開ループ試験が推奨されているが、実システムにおいて開ループ試験を行うことが難しい場合がある。したがって、初期入出力データを開ループ試験および閉ループ試験を行ったそれぞれの場合におけるシミュレーションを検討する。さらに、ノズルのない理想的なケースとノズルのあるケースについて検討を行う。
標準VRFTでは開ループ試験が推奨されているが、実システムにおいて開ループ試験を行うことが難しい場合がある。したがって、初期入出力データを開ループ試験および閉ループ試験を行ったそれぞれの場合におけるシミュレーションを検討する。さらに、ノズルのない理想的なケースとノズルのあるケースについて検討を行う。
[閉ループ試験データの利用]
ノズルがない理想的な状況での検討を行った。vは分散0の白色雑音とした。閉ループ試験で与えた初期の入出力データを図4に示す。設定値は矩形波のランダム信号(最小値-1、最大値5)を印加し、入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPID)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データをそれぞれ、図5および図6に示す。比較のため、古典的なPID制御器を用いたときの時系列データを図7に示す。PIDゲイン(Kp=0.059、Ki=0.058、Kd=0.0038)は古典的に有名なCHR法により得た。これらの図に関して、上段が出力、下段が入力を示す。最小二乗法(MFC-VRFT-LS)を用いた時には、システムが発散した。これは過学習によるものであると考えられる。一方で、Ridge回帰(MFC-VRFT-Ridge)を用いた場合には、目標応答に追従していることが確認できた。また、CHRよりも高い制御性能が得られていた。図8に示すテーブルに最適化されたパラメータをおよび評価関数値示す。Ridge回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なMFCパラメータが得られたといえる。
ノズルがない理想的な状況での検討を行った。vは分散0の白色雑音とした。閉ループ試験で与えた初期の入出力データを図4に示す。設定値は矩形波のランダム信号(最小値-1、最大値5)を印加し、入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPID)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データをそれぞれ、図5および図6に示す。比較のため、古典的なPID制御器を用いたときの時系列データを図7に示す。PIDゲイン(Kp=0.059、Ki=0.058、Kd=0.0038)は古典的に有名なCHR法により得た。これらの図に関して、上段が出力、下段が入力を示す。最小二乗法(MFC-VRFT-LS)を用いた時には、システムが発散した。これは過学習によるものであると考えられる。一方で、Ridge回帰(MFC-VRFT-Ridge)を用いた場合には、目標応答に追従していることが確認できた。また、CHRよりも高い制御性能が得られていた。図8に示すテーブルに最適化されたパラメータをおよび評価関数値示す。Ridge回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なMFCパラメータが得られたといえる。
次に、ノイズがある状況での検討を行った。vは分散1×10-3の白色雑音とした。設定値は矩形波のランダム信号(最小値-1、最大値5)を印加し、入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPIDゲイン)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データの図を省略する。最小二乗法(MFC-VRFT-LS)を用いた時には、システムが発散している。これは過学習によるものであると考えられる。一方で、Ridge回帰(MFC-VRFT-Ridge)を用いた場合には、目標応答に追従していることが確認できた。さらに、古典的に有名なCHR法と比較して高い応答性が得られている。パラメータおよび評価関数値を最適化した。最適化されたパラメータおよび評価関数値を示すテーブルを省略する。Ridge回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なMFCパラメータが得られたといえる。
[開ループ試験データの利用]
ノズルがない理想的な状況での検討を行った。vは分散0の白色雑音とした。開ループ試験で与えた初期の入出力データを省略する。入力はチャープサイン信号を印加し、そのときの入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPIDゲイン)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データを省略する。
ノズルがない理想的な状況での検討を行った。vは分散0の白色雑音とした。開ループ試験で与えた初期の入出力データを省略する。入力はチャープサイン信号を印加し、そのときの入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPIDゲイン)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データを省略する。
本実施の形態の手法は、CHR法と比較して高い応答性が得られていることが確認できた。Ridge回帰(MFC-VRFT-Ridge)の場合には、最小二乗法(MFC-VRFT-LS)のときと比較し、オーバシュートが少なくなっていた。これは過学習が抑制された結果、制御入力の変動も小さくなったためである。パラメータおよび評価関数値を最適化した。最適化されたパラメータおよび評価関数値を省略する。Ridge回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっていた。このことから、過学習が抑制され、より安定なMFCパラメータが得られたといえる。
次に、ノイズがある状況での検討を行った。vは分散1×10-3の白色雑音とした。入力はチャープサイン信号を印加し、入出力データを計測した。この入出力データからMFCの設計パラメータ(αおよびPIDゲイン)を最小二乗法(MFC-VRFT-LS)およびRidge回帰(MFC-VRFT-Ridge)で時系列データを求めた。求めたときの時系列データを省略する。本実施の形態の手法は、CHR法と比較して高い応答性が得られていることが確認できた。Ridge回帰(MFC-VRFT-Ridge)の場合には、最小二乗法(MFC-VRFT-LS)のときと比較し、オーバシュートが少なくなっている。これは過学習が抑制された結果、制御入力の変動も小さくなったためである。Ridge回帰を用いた場合には、最小二乗法を用いたときの結果と比較して、αの絶対値が大きく、比例ゲインおよび微分ゲインが小さい値となっている。このことから、過学習が抑制され、より安定なMFCパラメータが得られたといえる。これらの傾向はノイズがない理想的な条件と同等の結果である。
[試験の結論]
開ループ試験データと閉ループ試験において、ノイズの有無による最適化された制御パラメータの変動は小さいことを確認した。また、Ridge回帰を用いることで、過学習の抑制を可能にした。開ループ試験データを用いたときには、オーバシュートを抑制し、閉ループ試験データを用いた時には、システムの不安定化を避けることができることを確認した。開ループ試験および閉ループ試験データを用いて最適化されたパラメータの値には若干の違いがみられた。これは、入出力データの違いによると考えられる。ここでは、SISOシステムに限定したが、MIMOシステムへ拡張することもできる。
開ループ試験データと閉ループ試験において、ノイズの有無による最適化された制御パラメータの変動は小さいことを確認した。また、Ridge回帰を用いることで、過学習の抑制を可能にした。開ループ試験データを用いたときには、オーバシュートを抑制し、閉ループ試験データを用いた時には、システムの不安定化を避けることができることを確認した。開ループ試験および閉ループ試験データを用いて最適化されたパラメータの値には若干の違いがみられた。これは、入出力データの違いによると考えられる。ここでは、SISOシステムに限定したが、MIMOシステムへ拡張することもできる。
<実施の形態に係る情報処理装置1の機能構成>
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
図1は、実施の形態に係る閉ループ系を模式的に示す図であり、システム同定を介することなく制御対象モデルを用いずに、取得したデータからオフラインで最適制御パラメータを求めるための構成を示す図である。図1に示すように、実施の形態に係る情報処理装置1は、制御対象Pの入出力を取得し、制御対象Pの特性を推定し、参照モデルMdを設定し、プレフィルタ(式(23)を参照)を設定して、評価関数を導出するとともに、制御器Cの制御パラメータを出力する。なお、実施の形態に係る閉ループ系は、参照モデルMdを備える一般的な閉ループ系に情報処理装置1が追加されて構成されている。
図9は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。図9において、矢印は主なデータの流れを示しており、図9に示していないデータの流れがあってもよい。図9において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図9に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
記憶部2は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報などを格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。
制御部3は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部2に記憶されたプログラムを実行することによって特性推定部30、評価関数導出部31、及びパラメータ算出部32として機能する。
なお、図9は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部3を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。
実施の形態に係る情報処理装置1は、図9における制御器Cの制御パラメータを算出する。すなわち、情報処理装置1は、入力信号が入力される制御対象Pと、目標値と制御対象Pの出力との差分が入力され、上記の入力信号が出力される制御器Cと、目標値を入力として制御対象Pの出力をモデル化する参照モデルMdを備える制御システムにおける情報処理装置であって、制御器Cの制御パラメータを算出するパラメータ算出部32を備える。
制御器Cは、差分および当該差分に対応するパラメータ(フィードバック制御の設計パラメータ)、目標値および当該目標値に対応するパラメータ(フィードフォワード制御の設計パラメータ)、並びに、外乱および動特性を含む制御対象Pの特性および当該特性に対応するパラメータを含む制御パラメータに基づいて制御対象Pを制御する。
特性推定部30は、フィルタWFを用いて、制御対象Pの特性を推定する(式(10)を参照)。制御対象Pの特性とは、外乱および動特性を含む制御対象Pの特性である。外乱は、制御対象Pに加わる外乱である。動特性は、制御対象Pが有する例えば固有振動数や減衰特性などである。特性推定部30により推定された制御対象Pの特性の推定値Fハットは、評価関数導出部31により用いられる。
評価関数導出部31は、制御対象Pの特性の実値F(t)、制御対象Pの特性の推定値Fハット(t)、制御対象Pの入力u(t)、出力y(n)(t)(式(2)を参照)、および、y(t)を参照モデルMdの出力とみなした場合の参照モデルMdの仮想の参照入力Md
-1y(t)(式(18)を参照)、目標値yrから出力yまでの伝達特性が参照モデルMdに一致する場合の参照モデルMdの出力Mdyr(t)(式(17)を参照)に基づいて評価関数を導出する。以上のように導出された評価関数を式(26)および式(33)のそれぞれに示す。評価関数は、制御パラメータを要素とするパラメータベクトルw(式(28)を参照)に関して凸関数である。
パラメータ算出部32は、評価関数を最小にすることで、制御器Cの制御パラメータを算出する。具体的には、パラメータ算出部32は、評価関数を最適化する。評価関数を最適化する場合においては、評価関数が凸関数であるため、最小二乗法又はRidge回帰を用いることが可能となる。式(26)に示す評価関数が最小二乗法を用いる場合の評価関数である。また、式(33)に示す評価関数がRidge回帰を用いる場合の評価関数である。なお、評価関数を最適化する場合、最小二乗法や、Ridge回帰の他に、Lasso回帰又はエラステックネット(Elastic Net)を用いてもよい。
<情報処理装置1が実行する情報処理の処理フロー>
図10は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
図10は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
図10に示すように、先ず、特性推定部30は、フィルタWFを用いて、制御対象Pの特性を推定する(S1)。
次に、評価関数導出部31は、特性推定得部30が推定した制御対象Pの特性の推定値Fハット、制御対象Pの特性の実値F、制御対象Pの入出力データ、および、参照モデルMdの入出力データに基づいて、評価関数を導出する(S2)。
次に、パラメータ算出部32は、評価関数を最小にすることで、MFCに含まれる設計パラメータを算出する(S3)。その後、図10に示すフローは終了する。
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、MFCを用いる。これにより、複雑な特性をもつ産業システムに対する制御性能を確保することが可能となる。また、MFCおよびVRFTを用いることで、1組の実験データから、最適なMFC設計パラメータが求められる。すなわち、実験を繰り返し行うような繰り返しの手動調整が必要ないため、制御対象の数式モデルが得られない場合でも制御性能を発揮することが可能となる。また、MFCの設計パラメータの自動調整を実現するVRFTの評価関数を凸関数になるように導出する。これにより、非線形最適化が必要なく、短時間で最適パラメータが得られるため、時間・人的コストを低減することが可能となる。
以上説明したように、実施の形態に係る情報処理装置1によれば、MFCを用いる。これにより、複雑な特性をもつ産業システムに対する制御性能を確保することが可能となる。また、MFCおよびVRFTを用いることで、1組の実験データから、最適なMFC設計パラメータが求められる。すなわち、実験を繰り返し行うような繰り返しの手動調整が必要ないため、制御対象の数式モデルが得られない場合でも制御性能を発揮することが可能となる。また、MFCの設計パラメータの自動調整を実現するVRFTの評価関数を凸関数になるように導出する。これにより、非線形最適化が必要なく、短時間で最適パラメータが得られるため、時間・人的コストを低減することが可能となる。
パラメータ算出部32は、評価関数を最小にする制御パラメータを算出する場合、Ridge回帰を用いる。これにより、過学習を防ぐことが可能となる。また、一般にRidge回帰はハイパーパラメータを自動で決定し、ハイパーパラメータの設定が必要ないことから、簡便な自動調整が可能になる。
制御器Cは制御パラメータに基づいて制御対象Pを制御する。制御パラメータは、差分および当該差分に対するパラメータ(フィードバック制御における制御パラメータ)、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む。さらに、制御パラメータは、目標値および当該目標値に対するパラメータ(フィードフォワード制御における制御パラメータ)を含む。これにより、MFCに含まれる設計パラメータ(αおよびPIDゲイン)のすべてを、制御対象Pの入出力データからシステム同定を介することなく自動調整可能なパラメータとして扱うことが可能となる。
その他、上記実施の形態は、何れも本開示の実施をするにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
本開示は、複雑な特性をもつ産業システムに対する制御性能を確保し、制御対象の数式モデルが得られない場合でも制御性能を発揮し、時間・人的コストを低減することが要求される情報処理装置を備える制御システムに好適に利用される。
1 情報処理装置
2 記憶部
3 制御部
30 特性推定部
31 評価関数導出部
32 パラメータ算出部
2 記憶部
3 制御部
30 特性推定部
31 評価関数導出部
32 パラメータ算出部
Claims (5)
- 入力信号が入力される制御対象と、
目標値と前記制御対象の出力との差分が入力され、前記入力信号が出力される制御器と、
前記目標値を入力として前記制御対象の出力をモデル化する参照モデルと、
を備える制御システムにおける情報処理装置であって、
前記制御器は、前記差分および当該差分に対応するパラメータ、並びに、外乱および動特性を含む制御対象の特性および当該特性に対応するパラメータを含む制御パラメータに基づいて前記制御対象を制御し、
前記制御対象の出力と前記参照モデルの出力との誤差に関する評価関数に基づいて、前記制御パラメータを算出するパラメータ算出部を備え、
前記評価関数は、前記制御パラメータを要素とするパラメータベクトルに関して凸関数である、
情報処理装置。 - 前記パラメータ算出部は、前記評価関数を最小にすることで前記制御パラメータを算出する、
請求項1に記載の情報処理装置。 - 前記パラメータ算出部は、前記評価関数を最小にする前記制御パラメータを算出する場合、Ridge回帰を用いる、
請求項2に記載の情報処理装置。 - 前記パラメータ算出部は、前記評価関数に基づいて前記制御パラメータを算出する場合、最小二乗法を用いる、
請求項2に記載の情報処理装置。 - 前記制御パラメータは、前記目標値および当該目標値に対するパラメータを含む、
請求項1から4の何れか一項に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022072556A JP7327569B1 (ja) | 2022-04-26 | 2022-04-26 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022072556A JP7327569B1 (ja) | 2022-04-26 | 2022-04-26 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7327569B1 true JP7327569B1 (ja) | 2023-08-16 |
JP2023161913A JP2023161913A (ja) | 2023-11-08 |
Family
ID=87563042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022072556A Active JP7327569B1 (ja) | 2022-04-26 | 2022-04-26 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7327569B1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014127083A (ja) | 2012-12-27 | 2014-07-07 | Toyota Motor Corp | 車両動力プラントの制御装置 |
JP2020123092A (ja) | 2019-01-30 | 2020-08-13 | いすゞ自動車株式会社 | 情報処理装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6589523B2 (ja) * | 2015-09-30 | 2019-10-16 | ブラザー工業株式会社 | パラメータ更新方法、パラメータ更新装置、及びプログラム |
JP2021051457A (ja) * | 2019-09-24 | 2021-04-01 | いすゞ自動車株式会社 | 情報処理装置 |
JP7347377B2 (ja) * | 2020-09-01 | 2023-09-20 | いすゞ自動車株式会社 | パラメータ調整装置 |
-
2022
- 2022-04-26 JP JP2022072556A patent/JP7327569B1/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014127083A (ja) | 2012-12-27 | 2014-07-07 | Toyota Motor Corp | 車両動力プラントの制御装置 |
JP2020123092A (ja) | 2019-01-30 | 2020-08-13 | いすゞ自動車株式会社 | 情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2023161913A (ja) | 2023-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Baccoli et al. | Boundary control of coupled reaction–diffusion processes with constant parameters | |
Ortega et al. | Systematic design of weighting matrices for the H∞ mixed sensitivity problem | |
Wang et al. | Robust finite-time stability and stabilization of uncertain Markovian jump systems with time-varying delay | |
Jiang et al. | Robust adaptive dynamic programming | |
Xu et al. | Recurrent neural network for solving model predictive control problem in application of four-tank benchmark | |
Zhang et al. | Fuzzy adaptive control of nonlinear MIMO systems with unknown dead zone outputs | |
Rizvi et al. | Output feedback reinforcement learning control for the continuous-time linear quadratic regulator problem | |
JP2021051457A (ja) | 情報処理装置 | |
Wang et al. | Bounded growth of the bullwhip effect under a class of nonlinear ordering policies | |
Kumar et al. | Lyapunov stability-based control and identification of nonlinear dynamical systems using adaptive dynamic programming | |
Bayramoglu et al. | Time-varying sliding-coefficient-based decoupled terminal sliding-mode control for a class of fourth-order systems | |
Hager et al. | Adaptive Neural network control of a helicopter system with optimal observer and actor-critic design | |
Ghaemi et al. | Lyapunov–Krasovskii stable T2FNN controller for a class of nonlinear time-delay systems | |
JP7327569B1 (ja) | 情報処理装置 | |
Rehan et al. | Optimal non-parametric tuning of PID controllers based on classification of shapes of oscillations in modified relay feedback test | |
Biagiola et al. | Application of state estimation based NMPC to an unstable nonlinear process | |
Ling et al. | A methodology for control-relevant nonlinear system identification using restricted complexity models | |
Hermansson et al. | Multiple model predictive control of nonlinear pH neutralization system | |
Huang et al. | An adaptive state tracking control scheme for T–S fuzzy models in non-canonical form and with uncertain parameters | |
Pappas et al. | A robust optimization strategy for explicit model predictive control | |
JP7287420B2 (ja) | 情報処理装置 | |
da_Fonseca Neto et al. | On the convergence of DLQR control system design and recurrences of riccati and lyapunov in dynamic programming strategies | |
Saletovic | APM (simple MPC) vs. PID-Detailed comparison | |
JP7207474B1 (ja) | 情報処理装置 | |
Chien et al. | On-line hybrid intelligent tracking control for a class of nonaffine multivariable systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7327569 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |