JP2020123092A - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP2020123092A JP2020123092A JP2019013917A JP2019013917A JP2020123092A JP 2020123092 A JP2020123092 A JP 2020123092A JP 2019013917 A JP2019013917 A JP 2019013917A JP 2019013917 A JP2019013917 A JP 2019013917A JP 2020123092 A JP2020123092 A JP 2020123092A
- Authority
- JP
- Japan
- Prior art keywords
- control
- parameter
- output
- controller
- controlled object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Feedback Control In General (AREA)
Abstract
【課題】非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供する。【解決手段】制御対象の出力が制御器の入力にフィードバックされる制御システムにおいて、制御器の制御パラメータを算出する情報処理装置1は、制御対象に関する1又は複数の状態を軸とし、軸によって定義される空間に制御器の制御パラメータが配置されているルックアップテーブルと、制御対象の状態を取得する状態取得部30と、状態取得部30が取得した状態に基づいて、ルックアップテーブルを参照して制御パラメータを取得するパラメータ取得部31と、制御対象の出力と、参照モデルの出力との誤差に関する評価関数に基づいて、ルックアップテーブルに配置する制御パラメータを変更するテーブル変更部32と、を備える。【選択図】図6
Description
本発明は情報処理装置に関し、特に、フィードバックシステムの制御器の制御パラメータを調整する技術に関する。
産業界では閉ループ制御の大半はPID(Proportional-Integral-Differential)制御が多く用いられている。PID制御は、直感的に理解でき、計算負荷が小さいからだと考えられる。ここで、産業界における制御対象のほとんどは非線形システムである。このため、非線形制御理論の適用も一案として考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高い。このため、産業界では、直感的に理解でき、計算負荷の小さいゲインスケジュール制御が用いられることが多い(特許文献1参照)。
ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにゲインスケジュール制御で用いられるルックアップテーブル(Lookup table;以下「LUT」と記載する。)を事前に調整する必要がある。通常のPID制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの3つである。一方、ゲインスケジュール制御はLUTを用意する必要があるため、通常のPID制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。
本発明はこれらの点に鑑みてなされたものであり、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することを目的とする。
本発明の第1の態様は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置である。この装置は、前記制御対象に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御器の制御パラメータが配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記制御パラメータを取得するパラメータ取得部と、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数に基づいて、前記ルックアップテーブルに配置する前記制御パラメータを変更するテーブル変更部と、を備える。
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更してもよい。
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置すべき前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されてもよく、前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを逐次更新することにより、前記制御パラメータを変更してもよい。
前記評価関数は、(1)前記空間において前記制御パラメータを配置すべき位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されてもよく、前記テーブル変更部は、NLMS(Normalized Least Mean Square)法を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを逐次更新してもよい。
前記パラメータ取得部は、前記状態取得部が取得した状態に対応する前記空間の位置座標における前記制御パラメータを、前記位置座標の近傍に配置された前記制御パラメータの線形近似として算出してもよい。
本発明によれば、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。
<実施の形態の前提となる技術>
本発明の実施の形態を説明する前に、まず、本発明の実施の形態の前提とする前提技術について説明する。
本発明の実施の形態を説明する前に、まず、本発明の実施の形態の前提とする前提技術について説明する。
[1.緒言]
現在、産業界において、閉ループ制御の大半はPID制御が用いられている。これは、PID制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。
現在、産業界において、閉ループ制御の大半はPID制御が用いられている。これは、PID制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。
LUTを用いたゲインスケジュール制御は、あらかじめ制御対象の状態と制御器の制御パラメータとを紐づけて格納するLUTを参照することにより制御対象の状態に応じて制御器の制御パラメータを変更し、所望の制御性能を実現する手法である。このため、LUTを用いたゲインスケジュール制御はマップベース制御と呼ばれることもある。
ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにLUTを事前に調整する必要がある。通常のPID制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの3つである。一方、ゲインスケジュール制御はLUTを用意する必要があるため、通常のPID制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。
ここで、システム同定が困難な非線形システムに対して、制御対象のモデルを用いない制御手法として、FRIT(Fictitious Reference Iterative Tuning)やSPSA(Simultaneous Perturbation Stochastic Approximation Algorithm)、ニューラルネットワークを用いた手法が提案されている。非線形システムに対しては適応PID制御の適用も考えられるが、パラメータ変動が早いシステムの場合では、パラメータ更新を速くする必要があり、計算負荷が増大しかねない。
そこで、本発明の実施の形態では、制御対象の速い特性変動に関してはゲインスケジュール制御で対応し、経年劣化のような遅い特性変動に関してはゲインスケジュール制御に用いられるLUTをオンラインでメインテナンスしつつ更新する。
より具体的には、本発明の実施の形態は、ゲインスケジュールPID制御器を対象としたFRITの評価関数を導出し、オンライン最適化計算を実現するため評価関数を線形化する。線形化した評価関数が最小になるようにNLMS法により、最適制御パラメータの値を求める。
これにより、本発明の実施の形態は、オンラインで閉ループシステムのLUTを用いたゲインスケジュールPID制御の制御パラメータを自動調整することができる。なお、NLMSは収束時間がRLS(Recursive Least Squares)よりも要する傾向があるが安定性が高いため、経年変化の対応に適していると考える。これより、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。
[2.制御系設計]
FRITをオンラインパラメータ調整が可能なゲインスケジュール制御に対応できるよう拡張する。まず、ゲインスケジュール制御で使用する制御マップの構造について説明し、その後、通常FRITの拡張について説明する。最後に、ゲインスケジュール制御へ適用可能なFRITを導く。
FRITをオンラインパラメータ調整が可能なゲインスケジュール制御に対応できるよう拡張する。まず、ゲインスケジュール制御で使用する制御マップの構造について説明し、その後、通常FRITの拡張について説明する。最後に、ゲインスケジュール制御へ適用可能なFRITを導く。
[2.1.グリッドベース(Grid-Based)LUTの構造]
LUTを用いたゲインスケジュール制御は、エンジン制御等の産業システムで多岐にわたり用いられている。LUTは、制御対象に関する1又は複数の状態を軸とし、軸によって定義される空間に制御器の制御パラメータをグリッド状に配置して格納している。
LUTを用いたゲインスケジュール制御は、エンジン制御等の産業システムで多岐にわたり用いられている。LUTは、制御対象に関する1又は複数の状態を軸とし、軸によって定義される空間に制御器の制御パラメータをグリッド状に配置して格納している。
図1は、2次元の場合のLUTの構造を模式的に示す図である。図1において、x1、x2は、LUTへの入力でありcl,k、cl,k+1、c2,l、及びc2,l+1は補間ノードであり、θk,l、θk+1,l、θk,l+1、及びθk+1,l+1はLUTのテーブルデータ(マップデータ)である。
図1に示すLUTに制御対象の第1の状態を示す状態量である「状態1」と、制御対象の第2の状態を示す状態量である「状態2」と、の2つの状態量を入力すると、1つの出力値wLUが出力される。
制御対象の状態とは、例えば制御対象の温度や圧力、制御対象が運動を行う場合はその速度や運動量、又は、制御対象が存在する環境のパラメータ(温度や湿度等)であるが、これらに限定されるものではない。ここで、図1に示すように、LUTにはテーブルデータがグリッド状に離散的に格納されているため、状態1と状態2との任意の組み合わせにおいてテーブルデータが存在することは保証されていない。
そこで、実施の形態では、LUTを参照するための入力が与えられたときに、以下の式(1)及び式(2)に示す既知の補間技術を用いて出力値wLUを算出する。
式(1)に一般化基底関数φを導入すると、サイズM1×M2のLUTの出力は次式(3)で表せる。なお、サイズM1×M2のLUTとは、テーブルデータの数がM1×M2個のLUTであり、M1列、M2行の格子点上にテーブルデータが配置されているLUTである。
なお、基底関数はマップで表すか、又はLUTにおいて各テーブルデータが格納されている場所の位置座標を用いて次に示すアルゴリズムにより求められる。
for k=1:M1
for l=1:M2
if c1,k≦x1<c1,k+1 and c2,l≦x2<c2,l+1
φk,l(x,c)=Ak+1,l+1/A
φk+1,l(x,c)=Ak,l+1/A
φk,l+1(x,c)=Ak+1,l/A
φk+1,l+1(x,c)=Ak,l/A
else
φk,l(x,c) = φk+1,l(x,c) = φk,l+1(x,c) = φk+1,l+1(x,c) = 0
end
end
end
for l=1:M2
if c1,k≦x1<c1,k+1 and c2,l≦x2<c2,l+1
φk,l(x,c)=Ak+1,l+1/A
φk+1,l(x,c)=Ak,l+1/A
φk,l+1(x,c)=Ak+1,l/A
φk+1,l+1(x,c)=Ak,l/A
else
φk,l(x,c) = φk+1,l(x,c) = φk,l+1(x,c) = φk+1,l+1(x,c) = 0
end
end
end
[2.2.ゲインスケジュール制御のための自動調整機構]
一般的なFRITの説明を行った後、ゲインスケジュール制御を実現するための評価関数を線形化したFRITを導出する。
一般的なFRITの説明を行った後、ゲインスケジュール制御を実現するための評価関数を線形化したFRITを導出する。
[2.2.1.評価関数を線形化したFRIT]
図2は、参照モデルを備える閉ループ系を模式的に示す図である。FRITは1組の入出力データと参照モデルMから閉ループ系の制御器Cの制御パラメータθを自動調整する手法である。初期パラメータを用いて一組の閉ループ実験を行い、そのときの入出力データu0、y0を計測する。このとき、閉ループ系は安定であるとする。図1より、C(θ)(r−y)=uであるから、参照信号rはu及びyを用いて以下の式(4)で表せる。
図2は、参照モデルを備える閉ループ系を模式的に示す図である。FRITは1組の入出力データと参照モデルMから閉ループ系の制御器Cの制御パラメータθを自動調整する手法である。初期パラメータを用いて一組の閉ループ実験を行い、そのときの入出力データu0、y0を計測する。このとき、閉ループ系は安定であるとする。図1より、C(θ)(r−y)=uであるから、参照信号rはu及びyを用いて以下の式(4)で表せる。
図1に示す一般的なフィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差に関する評価関数Jは次式(5)で表せる。
実施の形態では、式(5)をオフラインでは計算せず、オンラインで計算する。以下では、式(5)をオンラインで計算するための準備として、FRITの評価関数Jを線形化する。
式(5)に示す評価関数Jが0となる理想的な場合を考えると式(6)を得る。
式(6)に式(4)を代入し、初期入出力データu0、y0を逐次計測している入出力u(t)、y(t)に置き換えて整理すると式(7)を得る。
式(7)を変形すると式(8)を得る。
式(5)において、フィードバック制御の応答と、参照モデル及び擬似参照信号から得られる目標応答との誤差をe(t)とすると、式(8)より、誤差e(t)は式(9)で表される。
式(9)を用いると、式(5)は式(10)のように変形できる。
[2.2.2.ゲインスケジュールPID制御器の自動パラメータ調整]
制御器は産業界で最も広く使われているPID制御とし、[2.1.]節で説明したLUTをゲインスケジューラとして用いると、制御器Cは次式で表される。
制御器は産業界で最も広く使われているPID制御とし、[2.1.]節で説明したLUTをゲインスケジューラとして用いると、制御器Cは次式で表される。
式(9)に式(11)〜式(13)を代入して整理すると、式(14)を得る。
式(14)において、パラメータベクトルw、ベクトルξ、及びベクトルdはそれぞれ以下の式(15)、式(16)及び式(17)で表される。
式(14)〜式(17)に示すように、フィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差e(t)は、LUTのテーブルデータから構成されるパラメータベクトルwに関して線形で表せる。
式(16)より、ξ(t)は、LUTにおいて各テーブルデータが格納されている場所の位置座標、参照モデルM、及び逐次計測している制御対象Pの出力y(t)を用いて算出できる。また、式(17)より、d(t)は、参照モデルM及び逐次計測している制御対象Pの入力u(t)(すなわち制御器Cの出力)を用いて算出できる。
式(14)から、評価関数Jは、(1)LUTにおいてテーブルデータを配置すべき位置座標、参照モデルM、及び制御対象Pの出力yから算出されるベクトルξと、LUTのテーブルデータを要素とするパラメータベクトルwとの内積と、(2)参照モデルM及び制御対象Pの入力信号uの積との差の二乗で定義される。
パラメータベクトルwは、LUTのテーブルデータから構成されるベクトルであるため既知であるが、ここでは制御対象Pの経年変化を考慮して修正すべき対象として扱う。以下の式(18)〜式(20)は、線形化した評価関数Jをオンラインで最小化にするためのNLMS法の更新式である。
実施の形態は、NLMS法によりLUTのパラメータをオンライン最適化する。最適化されたLUTを用いて、制御対象Pの状態により制御器Cの制御パラメータθを変更することにより、所望の制御性能を実現する。したがって、実施の形態に係る手法において、設計パラメータは参照モデルM、LUTにおいて各テーブルデータが格納されている場所の位置座標、及びNLMSの学習率μである。
[3.シミュレーションによる検討]
[3.1.システムの定式化]
シミュレーションを実行するための制御対象P、FRITの参照モデルM(s)、制御器Cの制御パラメータθの定式化を行う。
[3.1.システムの定式化]
シミュレーションを実行するための制御対象P、FRITの参照モデルM(s)、制御器Cの制御パラメータθの定式化を行う。
制御対象は次式(21)に示すように1次遅れシステムとした。
[3.2.シミュレーション]
サンプリング時間は8msとし、離散化はゼロ次ホールドを用いた。パラメータaは制御対象の出力に応じて変化させた。
サンプリング時間は8msとし、離散化はゼロ次ホールドを用いた。パラメータaは制御対象の出力に応じて変化させた。
図3(a)−(f)は、2次元の場合のLUTの自動チューニングの前後におけるLUTの形状を模式的に示す図である。具体的には、図3(a)−(c)は、それぞれLUTの自動チューニング前の比例ゲインKp、積分ゲインKi、及び微分ゲインKdのLUTの形状を示している。図3(a)−(c)に示すLUTの例では、自動チューニング前の各LUTは入力の状態にかかわらず一定値(初期値)が出力される。
図3(d)−(f)は、それぞれLUTの自動チューニング後の比例ゲインKp、積分ゲインKi、及び微分ゲインKdのLUTの形状を示している。図3(d)−(f)に示すように、各LUTは、2つの入力(状態1及び状態2)と、一つの出力とが紐付けられている。
図4(a)−(b)は、図2に示す閉ループ系において、ステップ入力を目標値としたときのシミュレーション結果を示す図である。図4(a)−(b)における横軸は時間、縦軸は参照軌道(実線)と応答(一点鎖線)である。
具体的には、図4(a)は1回目のステップ入力における参照軌道と応答とを示すグラフであり、図4(b)は、20回目のステップ入力における参照軌道と応答とを示すグラフである。図4(a)−(b)より、任意の初期パラメータでは参照軌道と応答の誤差が大きいが、ステップ応答が20回目のときには参照軌道と応答がほぼ一致しており、図上では区別がつかない。これより、実施の形態に係る手法は、最適なLUTが自動的に得られていると考えられる。すなわち、実施の形態に係る手法は、ゆるやかな経年変化に対応できるといえる。
なお、評価関数値に関して、実施の形態に係る手法は従来手法に対して約7%にまで低減した。これより、最適化したLUTを用いた制御の効果の高さを確認できる。以上の結果から、実施の形態に係る手法はオンラインでLUTを自動最適化できることがわかった。すなわち、実施の形態に係る手法は、人の手によるパラメータ調整に頼らずに最適な制御器Cの制御パラメータθの決定や、LUTの経年変化への対応が可能になったといえる。
<実施の形態に係る情報処理装置1の機能構成>
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
図5は、実施の形態に係る閉ループ系を模式的に示す図であり、制御モデルを用いずに自動調整則を有するゲインスケジュールPID制御を実現するための構成を示す図である。図5に示すように、実施の形態に係る情報処理装置1は、制御対象Pへの入力u、制御対象の出力y、制御対象Pの状態X、参照モデルMの出力M(s)rを取得して、ゲインスケジュール制御を実現するためのLUTを更新するとともに、制御器Cの制御パラメータθを出力する。図5から明らかなように、実施の形態に係る閉ループ系は、図2に示した参照モデルを備える一般的な閉ループ系に情報処理装置1が追加されて構成されている。
図6は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。図6において、矢印は主なデータの流れを示しており、図6に示していないデータの流れがあってもよい。図6において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図6に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
記憶部2は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報、制御対象Pの状態と制御器Cの制御パラメータθとを紐づけて格納するLUTを格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。
制御部3は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部2に記憶されたプログラムを実行することによって状態取得部30、パラメータ取得部31、及びテーブル変更部32として機能する。
なお、図6は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部3を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。
前提技術の[2・1・1]節で説明したように、実施の形態に係る情報処理装置1は、図5における制御器Cの制御パラメータθを算出する。すなわち、情報処理装置1は、制御器Cと、制御器Cの出力を入力とする制御対象Pと、制御対象Pに入力する入力信号を入力として制御対象Pの出力をモデル化する参照モデルMを備え、制御対象Pの出力が制御器Cの入力にフィードバックされる制御システムSにおいて、制御器Cの制御パラメータθを算出する。また、情報処理装置1は、制御器Cの制御パラメータθを算出するために用いられるLUTのテーブルデータも変更する。
前提技術の[2.1]節で説明したように、記憶部2が格納するLUTは、制御対象Pに関する1又は複数の状態を軸とし、軸によって定義される空間に制御器Cの制御パラメータθが配置して格納している。
状態取得部30は、制御対象Pの状態Xを取得する。前提技術の[2.1]節で説明したように、制御対象Pの状態Xとは、例えば、制御対象Pの温度や圧力、制御対象Pが運動を行う場合はその速度や運動量、制御対象Pが存在する環境のパラメータ(温度や湿度等)である。
パラメータ取得部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して制御器Cの制御パラメータθを取得する。具体的には、パラメータ取得部31は、前提技術の[2.1]節で説明した式(1)又は式(3)に基づいて、制御器Cの制御パラメータθを算出することによって取得する。これにより、情報処理装置1は、制御対象Pの速い特性変動に関して迅速に制御パラメータθを取得することができる。
テーブル変更部32は、制御対象Pの出力と、参照モデルMの出力との誤差に関する評価関数Jに基づいて、LUTに配置するテーブルデータである制御パラメータθを変更する。具体的には、テーブル変更部32は、前提技術の[2.1.1]節で説明した式(5)に示す評価関数Jが小さくなるように、LUTに配置するテーブルデータを変更する。これにより、情報処理装置1は、経年劣化が原因で制御対象Pの特性が変動しても、LUTに格納すべきテーブルデータである制御パラメータθをオンラインで自動的に調整することができる。
ここで、上述したように、LUTに配置するテーブルデータの変更は、制御対象Pの経年劣化等に対応するための処理である。したがって、テーブル変更部32が常に可動している必要は必ずしもない。むしろ、制御の安定性を考慮した場合、LUTに配置するテーブルデータはむやみに変更すべきではない。
そこで、テーブル変更部32は、式(5)に示す評価関数Jの評価値が所定の範囲から外れた場合に、評価関数Jの評価値が所定の範囲に含まれるようにLUTに配置するテーブルデータである制御パラメータθを変更する。
ここで「所定の範囲」とは、LUTの変更の必要性の有無を決定するためにテーブル変更部32が参照する「LUT変更決定用範囲」である。具体的には、式(5)に示す評価関数Jは評価値が小さいほど良い評価となるため、所定の範囲は0〜上限値の範囲となる。すなわち、テーブル変更部32は、評価関数Jの評価値が上限値を超えた場合、評価関数Jの評価値が上限値を下回るように、LUTに配置するテーブルデータを変更する。この上限値の具体的な値は、制御対象Pに関する先見情報や、制御に求められる精度等を勘案して実験により定めればよい。これにより、情報処理装置1は、不必要なLUTの変更処理に計算リソースが割り当てられることを抑制できるとともに、制御器Cによる制御対象Pの制御の安定性を維持することができる。
前提技術の[2.2.2]節の式(14)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eは、LUTに配置すべきテーブルデータである制御パラメータθを要素とするパラメータベクトルw(式(15))に対して線形となるように定義されている。
そこで、テーブル変更部32は、制御対象Pの出力と参照モデルMの出力との誤差eが小さくなるように、式(15)に示すパラメータベクトルwを逐次更新することにより、LUTに配置すべき制御パラメータθを変更する。
より具体的には、テーブル変更部32は、式(18)〜式(20)に示す更新式に基づいて、パラメータベクトルwを逐次更新する。式(18)〜式(20)に示す更新式はNLMS法の更新式である。一般に、NLMS法は、一般的な逐次最小二乗法と比較して安定性が高いものの収束時間が長い傾向にある。しかしながら、LUTに配置するテーブルデータの変更は制御対象Pの経年劣化等に対応するための処理であるため、収束時間が長いことは問題となりにくい。
このように、テーブル変更部32がNLMS法を用いて評価関数Jの評価値が小さくなるようにパラメータベクトルwを逐次更新することにより、情報処理装置1は、制御器Cにより制御対象Pの制御の安定性を維持することができる。
前提技術の[2.1]節の式(1)又は式(3)に示すように、パラメータ取得部31は、状態取得部30が取得した制御対象Pの状態Xに対応するLUTの位置座標における制御パラメータθを、位置座標の近傍に配置された制御パラメータθの線形近似として算出する。このように、パラメータ取得部31がLUTのテーブルデータから制御パラメータθを線形演算で算出することにより、最終的に式(14)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eをLUTのテーブルデータに対して線形とすることができる。
<情報処理装置1が実行する情報処理の処理フロー>
図7は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
図7は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
状態取得部30は、制御対象Pの状態Xを取得する(S2)。パラメータ取得部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して制御器Cの制御パラメータθを取得する(S4)。
テーブル変更部32は、評価関数Jの評価値を算出して取得する(S6)。評価値が所定の範囲から外れている場合(S8のNo)、テーブル変更部32は、評価関数Jの評価値が所定の範囲に含まれるように、LUTに格納する制御パラメータθを変更する(S10)。評価値が所定の範囲内の場合(S8のYes)、又はテーブル変更部32がLUTを変更すると、本フローチャートにおける処理は終了する。
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。
以上説明したように、実施の形態に係る情報処理装置1によれば、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。
<第1の変形例>
上記では、評価関数Jが式(9)に示す式から構成される場合について説明したが、評価関数Jを構成する式の形は式(9)に限定されない。この他、評価関数Jを構成する式の形は、以下に示す式(23)又は式(24)であってもよい。
上記では、評価関数Jが式(9)に示す式から構成される場合について説明したが、評価関数Jを構成する式の形は式(9)に限定されない。この他、評価関数Jを構成する式の形は、以下に示す式(23)又は式(24)であってもよい。
式(23)及び式(24)は、いずれもプラントモデルを用いずに参照応答と実応答の誤差を小さくする制御器パラメータを最適化することを目的としている。評価関数が制御器パラメータに対して線形で表すことができれば、これらの評価関数以外にも適用可能である。特に式(24)は、VRFT(Virtual Reference Feedback Tuning)として知られている。
<第2の変形例>
上記では、テーブル変更部32がNLMS法を用いてパラメータベクトルwを逐次更新する場合について説明した。しかしながら、テーブル変更部32が採用する最適化手法は、NLMS法に限られない。例えば、テーブル変更部32は、最急降下法や共益勾配法等のNLMS法以外の他の最適化手法を用いてパラメータベクトルwを更新してもよい。
上記では、テーブル変更部32がNLMS法を用いてパラメータベクトルwを逐次更新する場合について説明した。しかしながら、テーブル変更部32が採用する最適化手法は、NLMS法に限られない。例えば、テーブル変更部32は、最急降下法や共益勾配法等のNLMS法以外の他の最適化手法を用いてパラメータベクトルwを更新してもよい。
1・・・情報処理装置
2・・・記憶部
3・・・制御部
30・・・状態取得部
31・・・パラメータ取得部
32・・・テーブル変更部
C・・・制御器
P・・・制御対象
M・・・参照モデル
2・・・記憶部
3・・・制御部
30・・・状態取得部
31・・・パラメータ取得部
32・・・テーブル変更部
C・・・制御器
P・・・制御対象
M・・・参照モデル
Claims (5)
- 制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御器の制御パラメータが配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記制御パラメータを取得するパラメータ取得部と、
前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数に基づいて、前記ルックアップテーブルに配置する前記制御パラメータを変更するテーブル変更部と、
を備える情報処理装置。 - 前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項1に記載の情報処理装置。 - 前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置すべき前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを逐次更新することにより、前記制御パラメータを変更する、
請求項1又は2に記載の情報処理装置。 - 前記評価関数は、(1)前記空間において前記制御パラメータを配置すべき位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、NLMS(Normalized Least Mean Square)法を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを逐次更新する、
請求項3に記載の情報処理装置。 - 前記パラメータ取得部は、前記状態取得部が取得した状態に対応する前記空間の位置座標における前記制御パラメータを、前記位置座標の近傍に配置された前記制御パラメータの線形近似として算出する、
請求項1から4のいずれか1項に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019013917A JP2020123092A (ja) | 2019-01-30 | 2019-01-30 | 情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019013917A JP2020123092A (ja) | 2019-01-30 | 2019-01-30 | 情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020123092A true JP2020123092A (ja) | 2020-08-13 |
Family
ID=71993581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019013917A Pending JP2020123092A (ja) | 2019-01-30 | 2019-01-30 | 情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020123092A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022041661A (ja) * | 2020-09-01 | 2022-03-11 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP2022088859A (ja) * | 2020-12-03 | 2022-06-15 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP2022181936A (ja) * | 2021-05-27 | 2022-12-08 | いすゞ自動車株式会社 | 情報処理装置 |
JP2022181937A (ja) * | 2021-05-27 | 2022-12-08 | いすゞ自動車株式会社 | 情報処理装置 |
JP7327569B1 (ja) | 2022-04-26 | 2023-08-16 | いすゞ自動車株式会社 | 情報処理装置 |
JP7327592B1 (ja) | 2022-06-22 | 2023-08-16 | いすゞ自動車株式会社 | パラメータ調整装置 |
-
2019
- 2019-01-30 JP JP2019013917A patent/JP2020123092A/ja active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022041661A (ja) * | 2020-09-01 | 2022-03-11 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP7347377B2 (ja) | 2020-09-01 | 2023-09-20 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP2022088859A (ja) * | 2020-12-03 | 2022-06-15 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP2022181936A (ja) * | 2021-05-27 | 2022-12-08 | いすゞ自動車株式会社 | 情報処理装置 |
JP2022181937A (ja) * | 2021-05-27 | 2022-12-08 | いすゞ自動車株式会社 | 情報処理装置 |
JP7327569B1 (ja) | 2022-04-26 | 2023-08-16 | いすゞ自動車株式会社 | 情報処理装置 |
JP2023161913A (ja) * | 2022-04-26 | 2023-11-08 | いすゞ自動車株式会社 | 情報処理装置 |
JP7327592B1 (ja) | 2022-06-22 | 2023-08-16 | いすゞ自動車株式会社 | パラメータ調整装置 |
JP2024001597A (ja) * | 2022-06-22 | 2024-01-10 | いすゞ自動車株式会社 | パラメータ調整装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020123092A (ja) | 情報処理装置 | |
JP2021051457A (ja) | 情報処理装置 | |
Kaitwanidvilai et al. | Robust loop shaping–fuzzy gain scheduling control of a servo-pneumatic system using particle swarm optimization approach | |
JP2015232436A (ja) | 蒸気圧縮システムを制御するシステム及び方法 | |
KR101849464B1 (ko) | Pid 게인 자동 튜닝 방법 | |
Xargay et al. | L1 adaptive flight control system: systematic design and verification and validation of control metrics | |
JP2021051538A (ja) | 情報処理装置 | |
JP2012190364A (ja) | 制御パラメータ調整装置及び制御パラメータ調整方法 | |
JP2021051462A (ja) | 情報処理装置及びプログラム | |
EP2913724B1 (en) | PLC with a finite horizon optimization control program | |
JP5581528B1 (ja) | 制御パラメータ決定装置、方法、及びプログラム、並びに、制御器及び最適化制御システム | |
CN112836425A (zh) | 一种基于粒子群优化算法的圆柱体拟合方法及装置 | |
JP2006145432A (ja) | 磁力支持装置の制御定数自動調整方法 | |
JP2022112300A (ja) | パラメータ調整装置及びパラメータ調整方法 | |
WO2021006332A1 (ja) | 情報処理装置、プログラム、及び算出方法 | |
JP2023031898A (ja) | 情報処理装置 | |
JP2022181937A (ja) | 情報処理装置 | |
JP2022181936A (ja) | 情報処理装置 | |
JP7275492B2 (ja) | 制御装置、制御方法及びプログラム | |
JP7327569B1 (ja) | 情報処理装置 | |
Şahin et al. | Metaheuristic algorithm based PI controller design for Linearized Quadruple-Tank Process | |
JP7287420B2 (ja) | 情報処理装置 | |
JP7207474B1 (ja) | 情報処理装置 | |
Fomichev | Sufficient conditions for the stabilization of linear dynamical systems | |
JP7207473B1 (ja) | 情報処理装置 |