JP2022181936A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2022181936A JP2022181936A JP2021089182A JP2021089182A JP2022181936A JP 2022181936 A JP2022181936 A JP 2022181936A JP 2021089182 A JP2021089182 A JP 2021089182A JP 2021089182 A JP2021089182 A JP 2021089182A JP 2022181936 A JP2022181936 A JP 2022181936A
- Authority
- JP
- Japan
- Prior art keywords
- parameter
- controlled object
- control
- output
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 45
- 238000011156 evaluation Methods 0.000 claims abstract description 48
- 239000013598 vector Substances 0.000 claims description 27
- 230000008859 change Effects 0.000 abstract description 18
- 230000006870 function Effects 0.000 description 39
- 238000000034 method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 16
- 238000003860 storage Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 238000011045 prefiltration Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000013643 reference control Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001687 destabilization Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012892 rational function Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Abstract
【課題】制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供する。【解決手段】フィードバック制御システムにおいて、制御器の制御パラメータを算出する情報処理装置は、制御対象あるいは外部入力に関する1又は複数の状態を軸とし、軸によって定義される空間に制御パラメータを算出するために用いられる複数のパラメータ値が配置されているルックアップテーブルと、制御対象の状態を取得する状態取得部と、状態取得部が取得した状態に基づいて、ルックアップテーブルを参照して複数のパラメータ値に基づいて制御パラメータを生成するパラメータ生成部と、制御対象の出力と、参照モデルの出力との誤差に関する評価関数についてのLASSO回帰の結果に基づいて、ルックアップテーブルに配置する複数のパラメータ値を変更するテーブル変更部と、を備える。【選択図】図7
Description
本開示は、情報処理装置に関する。
産業システムの閉ループ制御の大半は直感的に理解できるPID制御が用いられている。線形性の強い制御対象であれば所望の制御性能が得られるが、非線形システムの場合、ゲインが固定されたPID制御で十分な制御性能を得ることは難しい。非線形制御理論やモデルベース制御の適用も考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きいため非線形制御適用のハードルが高い。また,産業システムは複雑であり精度の高いモデルを得ることが難しい場合が多く、モデルベース制御の効果が十分に発揮できない場合がある。このような背景から、産業界ではルックアップテーブル(Look-up table:以下「LUT」と記載する)を用いたゲインスケジュールPID制御がよく用いられる(例えば、特許文献1を参照)。
ゲインスケジュール制御は制御対象の状態に応じて制御器パラメータを変更し、所望の制御性能を実現する手法である。このような考え方は直観的に理解しやすく産業界では受け入れやすい。その反面,所望の制御性能を得るために大量の制御パラメータを事前に調整する必要がある。固定PID制御であれば調整パラメータは比例ゲイン、積分ゲイン、微分ゲインの3つであるが、LUTを用いたゲインスケジュール制御の場合、はるかに大きな数のパラメータを調整しなくてはならず、パラメータ調整に多くの時間を要している。近年,システム同定を介することなく制御対象モデルを用いない制御系設計法が注目されている.オフラインで取得したデータから最適制御パラメータを求める手法として、VRFT(Virtual Reference Feedback Tuning)(例えば、特許文献2を参照)やFRIT(Fictitious Reference Feedback Tuning)が提案されている。
VRFTやFRITといったデータ駆動制御は、繰り返し実験を行うことなく一組の入出力データからオフラインで制御器パラメータが得られるという点で注目されている。以上のような制御対象のモデルを用いない制御手法は、プロセス系や自動車システム等の産業システム,振動制御問題への適用も進められている。これまで、非線形システムに対するデータ駆動制御手法の検討もされているが、LUTパラメータの自動調整法に対しての検討はされていない。
ところで、固定PIDゲインを求める一般的なVRFTでは、制御対象の状態に応じて制御パラメータが変化しないため、PIDゲインが目標応答に十分に追従できないという問題もある。
本開示はこれらの点に鑑みてなされたものであり、制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供することを目的とする。
上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象または外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのLASSO回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。
前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成してもよい。
前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じてもよい
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更してもよい。
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更してもよい。
前記評価関数は、(1)前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、前記テーブル変更部は、LASSO回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更してもよい。
本開示によれば、制御対象の状態に応じて制御パラメータを変化させることができる。
<実施の形態の前提となる技術>
本開示の実施の形態を説明する前に、まず、本開示の実施の形態が前提とする前提技術について説明する。
本開示の実施の形態を説明する前に、まず、本開示の実施の形態が前提とする前提技術について説明する。
[緒言]
現在、産業界において、閉ループ制御の大半はPID制御が用いられている。これは、PID制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。
現在、産業界において、閉ループ制御の大半はPID制御が用いられている。これは、PID制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。
LUTを用いたゲインスケジュール制御は、あらかじめ制御対象の状態と制御器の制御パラメータの生成に用いられるパラメータ値とを紐づけて格納するLUTを参照することにより制御対象の状態に応じて制御器の制御パラメータを変更し、所望の制御性能を実現する手法である。このため、LUTを用いたゲインスケジュール制御はマップベース制御と呼ばれることもある。
ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにLUTを事前に調整する必要がある。通常のPID制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの3つである。一方、ゲインスケジュール制御はLUTを用意する必要があるため、通常のPID制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。
そこで、本開示では、ゲインスケジュールPID制御のスケジューリング関数(スケジューラ)であるLUTパラメータを自動調整する方法を提案する。以下に、スケジューリング関数をLUTで表す。次に、ゲインスケジュールPID制御器を定義する。次に、ゲインスケジュールPID制御器を対象としたVRFTの評価関数を導出する。次に、評価関数が最小となるようにLASSO(least absolute shrinkage and selection operator)回帰により最適制御パラメータを求める。これにより、試行錯誤的なパラメータ調整や、システム同定が不要となる。
以下の説明においては、先ず、準備としてVRFTとゲインスケジュールPID制御について説明する。次に、問題設定について説明する。次に、VRFTを利用したゲインスケジュール制御パラメータの自動調整について説明する。次に、シミュレーション検証について説明する。
[VRFT]
VRFTは、開ループの入出力データからシステム同定を介さず、直接的に、制御パラメータを求める手法である。最適制御パラメータは参照モデルと閉ループ系が同じ特性となるように調整される。図1にVRFTの構造について示す。図1は、参照モデルを備える閉ループ系を模式的に示す図である。Cは制御器、Mは参照モデル、Pは制御対象(プラント)であり、uは入力、yは出力である。また、ρは制御器パラメータ、zはシフトオペレータである。rバー(t)はVRFTで提案されている仮想参照入力、eバー(t)は、VRFTで提案されている仮想誤差である。
VRFTは、開ループの入出力データからシステム同定を介さず、直接的に、制御パラメータを求める手法である。最適制御パラメータは参照モデルと閉ループ系が同じ特性となるように調整される。図1にVRFTの構造について示す。図1は、参照モデルを備える閉ループ系を模式的に示す図である。Cは制御器、Mは参照モデル、Pは制御対象(プラント)であり、uは入力、yは出力である。また、ρは制御器パラメータ、zはシフトオペレータである。rバー(t)はVRFTで提案されている仮想参照入力、eバー(t)は、VRFTで提案されている仮想誤差である。
VRFTの手順について簡単に説明する。
ステップ1:希望する閉ループの参照モデルをMdとする。また、制御対象の入出力データをu(t),y(t),t=1,...,Nとする。
ステップ2:y(t)を参照モデルの出力とみなすと、y(t)を発生する仮想の参照入力は次式のように決められる。なお、参照入力を「参照信号」または「疑似参照信号」ともいう。
ステップ3:この参照信号rバー(t)を図1の閉ループの参照入力と考える。このとき制御器で作られる操作量は、これを仮想操作量とすると、次式になる
ステップ4:この仮想操作量uバー(t)と操作量u(t)のデータが近づけば、コントローラをもつ閉ループは参照モデルに近いとみなせる。すなわち、最小化する評価関数は次式になる。
式(1),(2)により、上式は次のようになる。
ステップ5:プレフィルタLの導入
式(4)の項には、参照モデルMdの逆行列がありノンプロパーである。式(34)に示すプレフィルタの追加によりノンプロパーを回避する。このプレフィルタを式(4)に追加すると式(5)が得られる。
ここで、
ステップ1:希望する閉ループの参照モデルをMdとする。また、制御対象の入出力データをu(t),y(t),t=1,...,Nとする。
ステップ2:y(t)を参照モデルの出力とみなすと、y(t)を発生する仮想の参照入力は次式のように決められる。なお、参照入力を「参照信号」または「疑似参照信号」ともいう。
式(4)の項には、参照モデルMdの逆行列がありノンプロパーである。式(34)に示すプレフィルタの追加によりノンプロパーを回避する。このプレフィルタを式(4)に追加すると式(5)が得られる。
[ゲインスケジュールPID制御]
図2は、ゲインスケジュールPID制御のシステムを示す図である。図2に示すように、ゲインスケジュールPID制御のシステムは、制御対象Pと、制御器C(z,ρ)、可変な制御器パラメータρ、有理関数ベクトルψ(z)、スケジューリング関数f(x)により構成される。
図2に示す制御器C(z,ρ)は、次式で記述される。
ここで、
制御パラメータρは、スケジューリング関数f(x)に応じてゲインスケジュールされる。wiは、i番目のスケジューリング関数のパラメータベクトルである。
図2は、ゲインスケジュールPID制御のシステムを示す図である。図2に示すように、ゲインスケジュールPID制御のシステムは、制御対象Pと、制御器C(z,ρ)、可変な制御器パラメータρ、有理関数ベクトルψ(z)、スケジューリング関数f(x)により構成される。
図2に示す制御器C(z,ρ)は、次式で記述される。
[ルックアップテーブルの構造]
図3に、2次元の場合のグリッドベースルックアップテーブル(Grid-Based Look-up Table)の構成を示す。図3に示すx1,x2は、LUTへの入力、Cl,k,C1,k+1,C2,1、C2,l+1は、補間ノード、θk,l,θk+1,l,θk、l+1,θk+1,l+1は、テーブルデータ(LUTのパラメータ値)である。このとき、LUTへ入力が与えられときのLUTからの出力wLUは次式となる。
ここで、
図3に、2次元の場合のグリッドベースルックアップテーブル(Grid-Based Look-up Table)の構成を示す。図3に示すx1,x2は、LUTへの入力、Cl,k,C1,k+1,C2,1、C2,l+1は、補間ノード、θk,l,θk+1,l,θk、l+1,θk+1,l+1は、テーブルデータ(LUTのパラメータ値)である。このとき、LUTへ入力が与えられときのLUTからの出力wLUは次式となる。
図4は、ゲインスケジューラの構成を示す図である。図4に示すように、LUTから出力される複数のパラメータが重み付け加算された値が制御パラメータとなる。
重みは、状態量に近いテーブルデータの影響が大きく、状態量から遠いテーブルデータの影響を小さくするように、状態量と各ノードの面積Aが利用される。
なお、図3に示すLUTは、状態1に対応する軸と状態2に対応する軸とを有する二次元のLUTであるが、LUTは1つの状態に対応する1つの軸のみを有する一次元のLUTであってもよく、3つ以上の状態に対応する三次元以上のLUTであってもよい。
[モデル参照制御]
図5は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。図5に示すように、目標値rから出力yまでの入出力特性が、予め設定された参照モデルMdに一致するようなゲインスケジューラを構成するn個のパラメータベクトルwを自動で調整する場合に、次の評価関数JMRを最小にするゲインスケジュールの最適パラメータを得ることを目的とする。
ここで、wはスケジューリング関数f(x)を構成するパラメータベクトルである。
図5は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。図5に示すように、目標値rから出力yまでの入出力特性が、予め設定された参照モデルMdに一致するようなゲインスケジューラを構成するn個のパラメータベクトルwを自動で調整する場合に、次の評価関数JMRを最小にするゲインスケジュールの最適パラメータを得ることを目的とする。
[ゲインスケジュール制御パラメータの自動調整]
ここで、制御器は、例えば、速度型PID制御器とする。2次元LUTをゲインスケジューラとして用いると、ゲインスケジュールPID制御は次式で表される。なお、PID制御器を速度型PID制御器とするが、本開示は速度型PID制御器に限定されない。
ここで、
ここで、
である。ρは制御器の制御パラメータ、Kpは比例ゲイン、Kiは積分ゲイン、Kdは微分ゲインである。また、fpは比例ゲインに関するLUT、fiは積分ゲインに関するLUT、fdは微分ゲインに関するLUTである。wKp、wKi、wKdは、それぞれ比例ゲイン、積分ゲイン、微分ゲインに関するゲインスケジューラのパラメータベクトルである。φ(チルダ)は、式(12)に示した一般化基底関数を要素とする既知ベクトルであり、LUTにおいて各テーブルデータが格納されている場所の位置座標を用いて計算される。また、式中「T」はベクトルの転置を表す。
ここで、制御器は、例えば、速度型PID制御器とする。2次元LUTをゲインスケジューラとして用いると、ゲインスケジュールPID制御は次式で表される。なお、PID制御器を速度型PID制御器とするが、本開示は速度型PID制御器に限定されない。
式(5)に式(13)を代入し,式を整理すると、評価関数は次式が得られる。
ここで、
ここで、パラメータベクトルw、ベクトルξ,及び、ベクトルdのそれぞれは、以下の式(27)、式(28)及び式(29)で表される。
式(26)~式(29)に示すように、フィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差eLUT(t)は、LUTのテーブルデータから構成されるパラメータベクトルwに関して線形で表せる。
式(29)より、ξ(t)は、LUTにおいて各テーブルデータが格納されている場所の位置座標、参照モデルMd、及び、制御対象Pの出力y(t)を用いて算出できる。また、式(27)より、d(t)は、制御対象Pの入力u(t)(すなわち制御器Cの出力)を用いて算出できる。
式(25)および式(26)から、評価関数Jは、(1)LUTにおいてテーブルデータを配置すべき位置座標、参照モデルMd、及び制御対象Pの出力yから算出されるベクトルξと、LUTのテーブルデータを要素とするパラメータベクトルwとの内積と、(2)制御対象Pの入力信号uを用いて算出された値の積との差の二乗で定義される。
最小二乗法を適用した場合、非常に局所的にLUTのパラメータを求めることになり、そのパラメータと隣り合うパラメータとの差が極端に大きくなる場合がある。これは、PIDゲインが急変し、閉ループ系が不安定になることにつながる。本開示では、一般化LASSOを導入することで、互いに隣り合うパラメータの差の大きさに対しL1ノルムを導入する。
一般化LASSOを取り入れた評価関数は次式で表される。
λは設計パラメータであって、クロスバリデーション(Cross-validation)等の公知の手法により適切な値が求められる。また、クロスバリデーションにより、制御対象の入出力データ数が少ない場合や、制御対象の状態が急激に変化した場合でも、過学習が防止されるため、パラメータの局所的な最適化を防止できる。
一般化LASSOを取り入れた評価関数は次式で表される。
[アルゴリズム]
VRFTを用いたPIDゲインのスケジューリング関数の重み係数(制御パラメータ)の自動調整アルゴリズムについて説明する。
ステップ1:開ループ系で入出力データを計測する。
ステップ2:参照モデルを設定する。
ステップ3:スケジューリングパラメータの候補を決定し、PIDゲインそれぞれのスケジューリング関数を設計する。
ステップ4:プレフィルタを設計する。
ステップ5:評価関数を最小にするスケジューリング関数の重み係数(制御パラメータ)をLASSO回帰で求める。
なお、ステップ4において、たとえば、シミュレーションおよび実験にて実績のある次式のプレフィルタを用いる。ただし、プレフィルタはこれに限らない。
VRFTを用いたPIDゲインのスケジューリング関数の重み係数(制御パラメータ)の自動調整アルゴリズムについて説明する。
ステップ1:開ループ系で入出力データを計測する。
ステップ2:参照モデルを設定する。
ステップ3:スケジューリングパラメータの候補を決定し、PIDゲインそれぞれのスケジューリング関数を設計する。
ステップ4:プレフィルタを設計する。
ステップ5:評価関数を最小にするスケジューリング関数の重み係数(制御パラメータ)をLASSO回帰で求める。
なお、ステップ4において、たとえば、シミュレーションおよび実験にて実績のある次式のプレフィルタを用いる。ただし、プレフィルタはこれに限らない。
[シミュレーション検証]
非線形システムを制御対象とした。ここでは、非線形システムを記述するモデルとして広く用いられているHammerstein モデルを制御対象とした。
制御器を含めたシミュレーションのサンプリング周期は1(sec)とし、次式に示すようなHammerstein モデルを制御対象とした。
ここで、vは分散1×10-3の白色雑音とする。各時刻の目標値rを以下のように設定した。
参照モデルは次式を用いた。
スケジューリングパラメータを次式とした。
ゲインスケジューラは、式(9)を用いた。
非線形システムを制御対象とした。ここでは、非線形システムを記述するモデルとして広く用いられているHammerstein モデルを制御対象とした。
制御器を含めたシミュレーションのサンプリング周期は1(sec)とし、次式に示すようなHammerstein モデルを制御対象とした。
[検証結果]
入力はチャープサイン信号を印加し、入出力データを計測した。
従来の手法である標準VRFT(固定PIDゲイン)を用いたときの時系列データと、本開示の手法であるLUT-VRFT-LASSOを用いたとときの時系列データとを比較した。
従来の手法で求められた固定PIDゲインは、Kp=0.0389、Ki=0.2232、Kd=0.0000である。取得した入出力データから固定PIDゲインを求めたときの時系列データを図9に示す。また、本開示の手法でPIDゲインを求めたときの時系列データを図10に示す。なお、図9および図10のそれぞれにおいて、上段から、出力、入力、比例ゲイン、積分ゲイン、微分ゲインである。
図9および図10を参照して、従来の手法と本開示の手法とを比較すると、本開示の手法は、PIDゲインが制御対象の状態に応じて変化しており、PIDゲインが目標応答に追従していることが確認できた。
入力はチャープサイン信号を印加し、入出力データを計測した。
従来の手法である標準VRFT(固定PIDゲイン)を用いたときの時系列データと、本開示の手法であるLUT-VRFT-LASSOを用いたとときの時系列データとを比較した。
従来の手法で求められた固定PIDゲインは、Kp=0.0389、Ki=0.2232、Kd=0.0000である。取得した入出力データから固定PIDゲインを求めたときの時系列データを図9に示す。また、本開示の手法でPIDゲインを求めたときの時系列データを図10に示す。なお、図9および図10のそれぞれにおいて、上段から、出力、入力、比例ゲイン、積分ゲイン、微分ゲインである。
図9および図10を参照して、従来の手法と本開示の手法とを比較すると、本開示の手法は、PIDゲインが制御対象の状態に応じて変化しており、PIDゲインが目標応答に追従していることが確認できた。
また、本開示の手法における、制御対象の状態と比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれとの関係を図11A-図11Cに示す。なお、図11A-図11Cのそれぞれにおいて、state1軸は状態1の数量を表し、state2軸は状態2の数量を表す。縦軸は比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれを表す。
図11A-図11Cを参照すると、制御対象の状態1および状態2のそれぞれに応じて比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれが変化していることが確認できた。
図11A-図11Cを参照すると、制御対象の状態1および状態2のそれぞれに応じて比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれが変化していることが確認できた。
<実施の形態に係る情報処理装置1の機能構成>
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
図6は、実施の形態に係る閉ループ系を模式的に示す図であり、制御モデルを用いずに自動調整則を有するゲインスケジュールPID制御を実現するための構成を示す図である。図6に示すように、実施の形態に係る情報処理装置1は、制御対象Pへの入力u、制御対象の出力y、制御対象Pの状態X、参照モデルMの出力M(z-1)rを取得して、ゲインスケジュール制御を実現するためのLUTを変更するとともに、制御器Cの制御パラメータρを出力する。図6から明らかなように、実施の形態に係る閉ループ系は、図1に示した参照モデルを備える一般的な閉ループ系に情報処理装置1が追加されて構成されている。
図7は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。図7において、矢印は主なデータの流れを示しており、図7に示していないデータの流れがあってもよい。図7において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図7に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
記憶部2は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報、制御対象Pの状態と制御器Cの制御パラメータρとを紐づけて格納するLUTを格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。
制御部3は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部2に記憶されたプログラムを実行することによって状態取得部30、パラメータ生成部31、及びテーブル変更部32として機能する。
なお、図7は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部3を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。
[ゲインスケジュールPID制御]節で説明したように、実施の形態に係る情報処理装置1は、図6における制御器Cの制御パラメータρを算出する。すなわち、情報処理装置1は、制御器Cと、制御器Cの出力を入力とする制御対象Pと、制御対象Pに入力する入力信号を入力として制御対象Pの出力をモデル化する参照モデルMを備え、制御対象Pの出力が制御器Cの入力にフィードバックされる制御システムにおいて、制御器Cの制御パラメータρを算出する。また、情報処理装置1は、制御器Cの制御パラメータρを算出するために用いられるLUTのテーブルデータであるパラメータ値も変更する。
[ルックアップテーブルの構造]節で説明したように、記憶部2が格納するLUTは、制御対象Pに関する1又は複数の状態を軸とし、軸によって定義される空間に制御器Cの制御パラメータρが配置されて格納されている。
状態取得部30は、制御対象Pの状態Xを取得する。制御対象Pの状態Xとは、例えば、制御対象Pの温度や圧力、制御対象Pが運動を行う場合はその速度や運動量、制御対象Pが存在する環境のパラメータ(温度や湿度等)である。状態取得部30により取得されたデータは記憶部2に蓄積され、蓄積されたデータは、パラメータ生成部31により用いられる。これにより、LUTのパラメータはテーブル変更部32によりオフライン調整される。なお、状態取得部30により取得されたデータがリアルタイムで用いられることで、LUTのパラメータがテーブル変更部32によりオンライン調整されてもよい。
パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して複数のパラメータ値θi,jに基づいて制御パラメータρを生成する。具体的には、パラメータ生成部31は、式(8)又は式(13)に基づいて、複数のパラメータ値θi,jのそれぞれに、複数のパラメータ値θi,jのそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより制御パラメータρを生成する。パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xと複数のパラメータ値θi,jが対応する状態との距離dが近ければ近いほど大きな値の重みを複数のパラメータ値θi、jに乗じる。これにより、情報処理装置1は、制御対象Pの速い特性変動に応じて制御パラメータρを生成することができる。
テーブル変更部32は、制御対象Pの出力と、参照モデルMの出力との誤差に関する評価関数Jに基づいて、LUTに配置するテーブルデータである複数のパラメータ値θi,jを変更する。具体的には、テーブル変更部32は、式(13)に示す評価関数Jが小さくなるように、LUTに配置する複数のテーブルデータを変更する。これにより、情報処理装置1は、たとえば、経年劣化が原因で制御対象Pの特性が変動しても、LUTに格納すべきテーブルデータである複数のパラメータ値θi,jを自動的に調整することで、制御パラメータを最適な値に調整することができる。
ここで、LUTに配置するテーブルデータの変更は、制御対象Pの状態に対応して行われる。たとえば、制御対象Pの経年劣化等に対応してテーブルデータの変更が行われる。
そこで、テーブル変更部32は、式(13)に示す評価関数Jの評価値が所定の範囲から外れた場合に、評価関数Jの評価値が所定の範囲に含まれるようにLUTに配置するテーブルデータである複数のパラメータ値θi,jを変更する。
ここで「所定の範囲」とは、LUTの変更の必要性の有無を決定するためにテーブル変更部32が参照する「LUT変更決定用範囲」である。具体的には、式(13)に示す評価関数Jは評価値が小さいほど良い評価となるため、所定の範囲は0~上限値の範囲となる。すなわち、テーブル変更部32は、評価関数Jの評価値が上限値を超えた場合、評価関数Jの評価値が上限値を下回るように、LUTに配置するテーブルデータを変更する。この上限値の具体的な値は、制御対象Pに関する先見情報や、制御に求められる精度等を勘案して実験により定めればよい。これにより、情報処理装置1は、不必要なLUTの変更処理に計算リソースが割り当てられることを抑制できるとともに、制御器Cによる制御対象Pの制御の安定性を維持することができる。
式(26)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eは、LUTに配置すべきテーブルデータである複数のパラメータ値θi,jに基づく制御パラメータρを要素とするパラメータベクトルw(式(28))に対して線形となるように定義されている。
そこで、テーブル変更部32は、制御対象Pの出力と参照モデルMの出力との誤差eが小さくなるように、式(28)に示すパラメータベクトルwを変更することにより、LUTに配置すべき複数のパラメータ値θi,jを変更する。
より具体的には、テーブル変更部32は、式(33)に示す評価関数に基づいて、パラメータベクトルwを変更する。式(33)に示す式はLASSO回帰を取り入れた評価関数の式である。一般に、LASSO回帰は、一般的な逐次最小二乗法と比較して過学習を防止することで、パラメータの局所的な最適化を防止できるという利点がある。
このように、テーブル変更部32がLASSO回帰の導入で評価関数Jの評価値が小さくなるようにパラメータベクトルwを変更することにより、情報処理装置1は、制御器Cにより制御対象Pの制御の安定性を維持することができる。
パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに対応するLUTの位置座標からの距離に基づいて複数のパラメータ値θi,jを重み付け加算することにより制御パラメータρを算出する。このように、パラメータ生成部31がLUTのテーブルデータから制御パラメータρを線形演算で算出することにより、最終的に式(26)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eをLUTのテーブルデータに対して線形とすることができる。
<情報処理装置1が実行する情報処理の処理フロー>
図8は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
図8は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
状態取得部30は、制御対象Pの状態Xを取得する(S1)。パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して制御器Cの制御パラメータρを生成する(S2)。
テーブル変更部32は、評価関数Jの評価値を算出して取得する(S3)。評価値が所定の範囲から外れている場合(S4:NO)、テーブル変更部32は、評価関数Jの評価値が所定の範囲に含まれるように、LUTに格納する制御パラメータρを変更する(S5)。その後、本フローチャートにおける処理は終了する。評価値が所定の範囲内の場合(S4:YES)、本フローチャートにおける処理は終了する。
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、制御対象の状態に応じて制御パラメータを変化させるように構成したため、PIDゲインが目標応答に十分に追従可能となる。
以上説明したように、実施の形態に係る情報処理装置1によれば、制御対象の状態に応じて制御パラメータを変化させるように構成したため、PIDゲインが目標応答に十分に追従可能となる。
以上、本開示を実施の形態を用いて説明したが、本開示の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本開示の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。
その他、上記実施の形態は、何れも本開示の実施をするにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
本開示は、制御対象の状態に応じてパラメータを変化させることが要求される情報処理装置を備えた産業システム、特に、エンジンや自動変速機等の非線形性が強い産業システムに好適に利用される。
1 情報処理装置
2 記憶部
3 制御部
30 状態取得部
31 パラメータ生成部
32 テーブル変更部
C 制御器
P 制御対象
M 参照モデル
2 記憶部
3 制御部
30 状態取得部
31 パラメータ生成部
32 テーブル変更部
C 制御器
P 制御対象
M 参照モデル
上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御器に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象または外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、取得された前記制御対象の状態を蓄積する記憶部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、蓄積された前記制御対象の状態を用いて、オフラインで、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのLASSO回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。
Claims (6)
- 制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象または外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、
前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのLASSO回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、
を備える情報処理装置。 - 前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成する、
請求項1に記載の情報処理装置。 - 前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じる、
請求項2に記載の情報処理装置。 - 前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項1から3のいずれか一項に記載の情報処理装置。 - 前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更する、
請求項1から4のいずれか一項に記載の情報処理装置。 - 前記評価関数は、(1)前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、前記LASSO回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更する、
請求項5に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021089182A JP2022181936A (ja) | 2021-05-27 | 2021-05-27 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021089182A JP2022181936A (ja) | 2021-05-27 | 2021-05-27 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022181936A true JP2022181936A (ja) | 2022-12-08 |
Family
ID=84328847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021089182A Pending JP2022181936A (ja) | 2021-05-27 | 2021-05-27 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022181936A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015522757A (ja) * | 2012-07-26 | 2015-08-06 | エムエイチアイ ヴェスタス オフショア ウィンド エー/エス | 風力タービン傾斜最適化及び制御 |
WO2018078769A1 (ja) * | 2016-10-27 | 2018-05-03 | 株式会社日立製作所 | 制御装置 |
WO2020075737A1 (ja) * | 2018-10-11 | 2020-04-16 | 株式会社国際電気通信基礎技術研究所 | 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、及び脳活動バイオマーカシステム |
JP2020123092A (ja) * | 2019-01-30 | 2020-08-13 | いすゞ自動車株式会社 | 情報処理装置 |
JP2021051457A (ja) * | 2019-09-24 | 2021-04-01 | いすゞ自動車株式会社 | 情報処理装置 |
JP2021051538A (ja) * | 2019-09-25 | 2021-04-01 | いすゞ自動車株式会社 | 情報処理装置 |
-
2021
- 2021-05-27 JP JP2021089182A patent/JP2022181936A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015522757A (ja) * | 2012-07-26 | 2015-08-06 | エムエイチアイ ヴェスタス オフショア ウィンド エー/エス | 風力タービン傾斜最適化及び制御 |
WO2018078769A1 (ja) * | 2016-10-27 | 2018-05-03 | 株式会社日立製作所 | 制御装置 |
WO2020075737A1 (ja) * | 2018-10-11 | 2020-04-16 | 株式会社国際電気通信基礎技術研究所 | 脳機能結合相関値の調整方法、脳機能結合相関値の調整システム、脳活動分類器のハーモナイズ方法、脳活動分類器のハーモナイズシステム、及び脳活動バイオマーカシステム |
JP2020123092A (ja) * | 2019-01-30 | 2020-08-13 | いすゞ自動車株式会社 | 情報処理装置 |
JP2021051457A (ja) * | 2019-09-24 | 2021-04-01 | いすゞ自動車株式会社 | 情報処理装置 |
JP2021051538A (ja) * | 2019-09-25 | 2021-04-01 | いすゞ自動車株式会社 | 情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Prasad et al. | Optimal control of nonlinear inverted pendulum system using PID controller and LQR: performance analysis without and with disturbance input | |
JPH11509345A (ja) | 範囲制御を使用した多変数予想制御用の最適コントローラ設計方法 | |
JP2020123092A (ja) | 情報処理装置 | |
Mehdi et al. | A novel anti-windup framework for cascade control systems: An application to underactuated mechanical systems | |
JP2021051457A (ja) | 情報処理装置 | |
Dabiri et al. | Optimal fractional state feedback control for linear fractional periodic time-delayed systems | |
Pavlov et al. | Convergent systems: nonlinear simplicity | |
Yang et al. | Robust control for a class of nonlinear distributed parameter systems via proportional-spatial derivative control approach | |
JP2022181936A (ja) | 情報処理装置 | |
JP2022181937A (ja) | 情報処理装置 | |
Rudra et al. | Block backstepping control of the underactuated mechanical systems | |
JP2021051538A (ja) | 情報処理装置 | |
Simões et al. | Nonsmooth multi-objective synthesis with applications | |
Gürsoy-Demir et al. | A nonlinear disturbance observer-based adaptive integral sliding mode control for missile guidance system | |
JP7327569B1 (ja) | 情報処理装置 | |
Tulpule | Integrated robust optimal design (irod) via sensitivity minimization | |
Mehrabian et al. | Design of gain-scheduled autopilot for a highly-agile missile | |
JP7207474B1 (ja) | 情報処理装置 | |
Aguiar et al. | Comparative study of tuning techniques for fractional PID controllers for FOPDT systems | |
JP7207473B1 (ja) | 情報処理装置 | |
JP7287420B2 (ja) | 情報処理装置 | |
JPH0272404A (ja) | メンバーシップ関数決定方法 | |
JP7409345B2 (ja) | 学習処理装置、制御装置、学習処理方法、制御方法、学習プログラムおよび制御プログラム | |
JP2024001749A (ja) | パラメータ調整装置 | |
Zhang et al. | Cuckoo optimization algorithm visual positioning system based on particle swarm algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221006 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230110 |