JP2020123092A

JP2020123092A - 情報処理装置

Info

Publication number: JP2020123092A
Application number: JP2019013917A
Authority: JP
Inventors: 修一矢作; Shuichi Yahagi
Original assignee: Isuzu Motors Ltd
Current assignee: Isuzu Motors Ltd
Priority date: 2019-01-30
Filing date: 2019-01-30
Publication date: 2020-08-13

Abstract

【課題】非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供する。【解決手段】制御対象の出力が制御器の入力にフィードバックされる制御システムにおいて、制御器の制御パラメータを算出する情報処理装置１は、制御対象に関する１又は複数の状態を軸とし、軸によって定義される空間に制御器の制御パラメータが配置されているルックアップテーブルと、制御対象の状態を取得する状態取得部３０と、状態取得部３０が取得した状態に基づいて、ルックアップテーブルを参照して制御パラメータを取得するパラメータ取得部３１と、制御対象の出力と、参照モデルの出力との誤差に関する評価関数に基づいて、ルックアップテーブルに配置する制御パラメータを変更するテーブル変更部３２と、を備える。【選択図】図６

Description

本発明は情報処理装置に関し、特に、フィードバックシステムの制御器の制御パラメータを調整する技術に関する。

産業界では閉ループ制御の大半はＰＩＤ（Proportional-Integral-Differential）制御が多く用いられている。ＰＩＤ制御は、直感的に理解でき、計算負荷が小さいからだと考えられる。ここで、産業界における制御対象のほとんどは非線形システムである。このため、非線形制御理論の適用も一案として考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高い。このため、産業界では、直感的に理解でき、計算負荷の小さいゲインスケジュール制御が用いられることが多い（特許文献１参照）。

特開２０１２−１１３６７６号公報

ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにゲインスケジュール制御で用いられるルックアップテーブル（Lookup table；以下「ＬＵＴ」と記載する。）を事前に調整する必要がある。通常のＰＩＤ制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの３つである。一方、ゲインスケジュール制御はＬＵＴを用意する必要があるため、通常のＰＩＤ制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。

本発明はこれらの点に鑑みてなされたものであり、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することを目的とする。

本発明の第１の態様は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置である。この装置は、前記制御対象に関する１又は複数の状態を軸とし、前記軸によって定義される空間に前記制御器の制御パラメータが配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記制御パラメータを取得するパラメータ取得部と、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数に基づいて、前記ルックアップテーブルに配置する前記制御パラメータを変更するテーブル変更部と、を備える。

前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更してもよい。

前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置すべき前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されてもよく、前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを逐次更新することにより、前記制御パラメータを変更してもよい。

前記評価関数は、（１）前記空間において前記制御パラメータを配置すべき位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、（２）前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されてもよく、前記テーブル変更部は、ＮＬＭＳ（Normalized Least Mean Square）法を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを逐次更新してもよい。

前記パラメータ取得部は、前記状態取得部が取得した状態に対応する前記空間の位置座標における前記制御パラメータを、前記位置座標の近傍に配置された前記制御パラメータの線形近似として算出してもよい。

本発明によれば、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。

２次元の場合のＬＵＴの構造を模式的に示す図である。参照モデルを備える閉ループ系を模式的に示す図である。２次元の場合のＬＵＴの自動チューニングの前後におけるＬＵＴの形状を模式的に示す図である。図２に示す閉ループ系において、ステップ入力を目標値としたときのシミュレーション結果を示す図である。実施の形態に係る閉ループ系を模式的に示す図である。実施の形態に係る情報処理装置の機能構成を模式的に示す図である。実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。

＜実施の形態の前提となる技術＞
本発明の実施の形態を説明する前に、まず、本発明の実施の形態の前提とする前提技術について説明する。

［１．緒言］
現在、産業界において、閉ループ制御の大半はＰＩＤ制御が用いられている。これは、ＰＩＤ制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。

ＬＵＴを用いたゲインスケジュール制御は、あらかじめ制御対象の状態と制御器の制御パラメータとを紐づけて格納するＬＵＴを参照することにより制御対象の状態に応じて制御器の制御パラメータを変更し、所望の制御性能を実現する手法である。このため、ＬＵＴを用いたゲインスケジュール制御はマップベース制御と呼ばれることもある。

ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにＬＵＴを事前に調整する必要がある。通常のＰＩＤ制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの３つである。一方、ゲインスケジュール制御はＬＵＴを用意する必要があるため、通常のＰＩＤ制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。

ここで、システム同定が困難な非線形システムに対して、制御対象のモデルを用いない制御手法として、ＦＲＩＴ（Fictitious Reference Iterative Tuning）やＳＰＳＡ（Simultaneous Perturbation Stochastic Approximation Algorithm）、ニューラルネットワークを用いた手法が提案されている。非線形システムに対しては適応ＰＩＤ制御の適用も考えられるが、パラメータ変動が早いシステムの場合では、パラメータ更新を速くする必要があり、計算負荷が増大しかねない。

そこで、本発明の実施の形態では、制御対象の速い特性変動に関してはゲインスケジュール制御で対応し、経年劣化のような遅い特性変動に関してはゲインスケジュール制御に用いられるＬＵＴをオンラインでメインテナンスしつつ更新する。

より具体的には、本発明の実施の形態は、ゲインスケジュールＰＩＤ制御器を対象としたＦＲＩＴの評価関数を導出し、オンライン最適化計算を実現するため評価関数を線形化する。線形化した評価関数が最小になるようにＮＬＭＳ法により、最適制御パラメータの値を求める。

これにより、本発明の実施の形態は、オンラインで閉ループシステムのＬＵＴを用いたゲインスケジュールＰＩＤ制御の制御パラメータを自動調整することができる。なお、ＮＬＭＳは収束時間がＲＬＳ（Recursive Least Squares）よりも要する傾向があるが安定性が高いため、経年変化の対応に適していると考える。これより、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。

［２．制御系設計］
ＦＲＩＴをオンラインパラメータ調整が可能なゲインスケジュール制御に対応できるよう拡張する。まず、ゲインスケジュール制御で使用する制御マップの構造について説明し、その後、通常ＦＲＩＴの拡張について説明する。最後に、ゲインスケジュール制御へ適用可能なＦＲＩＴを導く。

［２．１．グリッドベース（Grid-Based）ＬＵＴの構造］
ＬＵＴを用いたゲインスケジュール制御は、エンジン制御等の産業システムで多岐にわたり用いられている。ＬＵＴは、制御対象に関する１又は複数の状態を軸とし、軸によって定義される空間に制御器の制御パラメータをグリッド状に配置して格納している。

図１は、２次元の場合のＬＵＴの構造を模式的に示す図である。図１において、ｘ_１、ｘ_２は、ＬＵＴへの入力でありｃ_ｌ，ｋ、ｃ_{ｌ，ｋ＋１}、ｃ_２，ｌ、及びｃ_{２，ｌ＋１}は補間ノードであり、θ_ｋ，ｌ、θ_{ｋ＋１，ｌ}、θ_{ｋ，ｌ＋１}、及びθ_{ｋ＋１，ｌ＋１}はＬＵＴのテーブルデータ（マップデータ）である。

図１に示すＬＵＴに制御対象の第１の状態を示す状態量である「状態１」と、制御対象の第２の状態を示す状態量である「状態２」と、の２つの状態量を入力すると、１つの出力値ｗ_ＬＵが出力される。

制御対象の状態とは、例えば制御対象の温度や圧力、制御対象が運動を行う場合はその速度や運動量、又は、制御対象が存在する環境のパラメータ（温度や湿度等）であるが、これらに限定されるものではない。ここで、図１に示すように、ＬＵＴにはテーブルデータがグリッド状に離散的に格納されているため、状態１と状態２との任意の組み合わせにおいてテーブルデータが存在することは保証されていない。

そこで、実施の形態では、ＬＵＴを参照するための入力が与えられたときに、以下の式（１）及び式（２）に示す既知の補間技術を用いて出力値ｗ_ＬＵを算出する。

式（１）、式（２）は、いわゆる線形近似（線形補間）を示す式である。

式（１）に一般化基底関数φを導入すると、サイズＭ１×Ｍ２のＬＵＴの出力は次式（３）で表せる。なお、サイズＭ１×Ｍ２のＬＵＴとは、テーブルデータの数がＭ１×Ｍ２個のＬＵＴであり、Ｍ１列、Ｍ２行の格子点上にテーブルデータが配置されているＬＵＴである。

なお、基底関数はマップで表すか、又はＬＵＴにおいて各テーブルデータが格納されている場所の位置座標を用いて次に示すアルゴリズムにより求められる。

for k=1:M₁
for l=1:M₂
if c_1,k≦x₁＜c_1,k+1 and c_2,l≦x₂＜c_2,l+1
φ_k,l(x,c)=A_k+1,l+1/A
φ_k+1,l(x,c)=A_k,l+1/A
φ_k,l+1(x,c)=A_k+1,l/A
φ_k+1,l+1(x,c)=A_k,l/A
else
φ_k,l(x,c) = φ_k+1,l(x,c) = φ_k,l+1(x,c) = φ_k+1,l+1(x,c) = 0
end
end
end

［２．２．ゲインスケジュール制御のための自動調整機構］
一般的なＦＲＩＴの説明を行った後、ゲインスケジュール制御を実現するための評価関数を線形化したＦＲＩＴを導出する。

［２．２．１．評価関数を線形化したＦＲＩＴ］
図２は、参照モデルを備える閉ループ系を模式的に示す図である。ＦＲＩＴは１組の入出力データと参照モデルＭから閉ループ系の制御器Ｃの制御パラメータθを自動調整する手法である。初期パラメータを用いて一組の閉ループ実験を行い、そのときの入出力データｕ_０、ｙ_０を計測する。このとき、閉ループ系は安定であるとする。図１より、Ｃ（θ）（ｒ−ｙ）＝ｕであるから、参照信号ｒはｕ及びｙを用いて以下の式（４）で表せる。

ここでＣ（θ）は制御器Ｃ、θは制御器Ｃの制御パラメータ、ｕ_０、ｙ_０は予め計測した１組の入出力データである。以下本明細書において、式（１）で示す参照信号ｒ（θ，ｋ）を擬似参照信号と表記することがある。

図１に示す一般的なフィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差に関する評価関数Ｊは次式（５）で表せる。

ここで、Ｍ（ｓ）はＦＲＩＴの参照モデル、ｓはラプラス演算子である。この評価関数Ｊを最小にする制御器Ｃの制御パラメータθがＦＲＩＴによって算出される制御パラメータθとなる。標準的なＦＲＩＴはオフライン計算によって式（５）を最小化するθを算出する。

実施の形態では、式（５）をオフラインでは計算せず、オンラインで計算する。以下では、式（５）をオンラインで計算するための準備として、ＦＲＩＴの評価関数Ｊを線形化する。

式（５）に示す評価関数Ｊが０となる理想的な場合を考えると式（６）を得る。

式（６）に式（４）を代入し、初期入出力データｕ_０、ｙ_０を逐次計測している入出力ｕ（ｔ）、ｙ（ｔ）に置き換えて整理すると式（７）を得る。

式（７）を変形すると式（８）を得る。

式（５）において、フィードバック制御の応答と、参照モデル及び擬似参照信号から得られる目標応答との誤差をｅ（ｔ）とすると、式（８）より、誤差ｅ（ｔ）は式（９）で表される。

式（９）を用いると、式（５）は式（１０）のように変形できる。

［２．２．２．ゲインスケジュールＰＩＤ制御器の自動パラメータ調整］
制御器は産業界で最も広く使われているＰＩＤ制御とし、［２．１．］節で説明したＬＵＴをゲインスケジューラとして用いると、制御器Ｃは次式で表される。

θは制御器Ｃの制御パラメータ、Ｋ_ｐは比例ゲイン、Ｋ_ｉは積分ゲイン、Ｋ_ｄは微分ゲインであり、それぞれ以下の式（１２）で表される。微分演算子ｓは近似微分器を用いてもよい。

ｆ_ｐは比例ゲインのＬＵＴ、ｆ_ｉは積分ゲインのＬＵＴ、ｆ_ｄは微分ゲインのＬＵＴである。ｗ^Ｋｐ、ｗ^Ｋｉ、ｗ^Ｋｄは、はそれぞれ比例、積分、微分ゲインに関するＬＵＴのテーブルデータから構成されるベクトルである。φは、式（３）に示した一般化基底関数を要素とする既知ベクトルであり、ＬＵＴにおいて各テーブルデータが格納されている場所の位置座標を用いて算出される。また、式中「Ｔ」はベクトルの転置を表し、「・」はベクトルの内積を表す。

式（１３）において、Ｍ＝Ｍ_１×Ｍ_２である。

式（９）に式（１１）〜式（１３）を代入して整理すると、式（１４）を得る。

式（１４）において、パラメータベクトルｗ、ベクトルξ、及びベクトルｄはそれぞれ以下の式（１５）、式（１６）及び式（１７）で表される。

式（１４）〜式（１７）に示すように、フィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差ｅ（ｔ）は、ＬＵＴのテーブルデータから構成されるパラメータベクトルｗに関して線形で表せる。

式（１６）より、ξ（ｔ）は、ＬＵＴにおいて各テーブルデータが格納されている場所の位置座標、参照モデルＭ、及び逐次計測している制御対象Ｐの出力ｙ（ｔ）を用いて算出できる。また、式（１７）より、ｄ（ｔ）は、参照モデルＭ及び逐次計測している制御対象Ｐの入力ｕ（ｔ）（すなわち制御器Ｃの出力）を用いて算出できる。

式（１４）から、評価関数Ｊは、（１）ＬＵＴにおいてテーブルデータを配置すべき位置座標、参照モデルＭ、及び制御対象Ｐの出力ｙから算出されるベクトルξと、ＬＵＴのテーブルデータを要素とするパラメータベクトルｗとの内積と、（２）参照モデルＭ及び制御対象Ｐの入力信号ｕの積との差の二乗で定義される。

パラメータベクトルｗは、ＬＵＴのテーブルデータから構成されるベクトルであるため既知であるが、ここでは制御対象Ｐの経年変化を考慮して修正すべき対象として扱う。以下の式（１８）〜式（２０）は、線形化した評価関数Ｊをオンラインで最小化にするためのＮＬＭＳ法の更新式である。

ここで、μは学習率を示す定数である。

実施の形態は、ＮＬＭＳ法によりＬＵＴのパラメータをオンライン最適化する。最適化されたＬＵＴを用いて、制御対象Ｐの状態により制御器Ｃの制御パラメータθを変更することにより、所望の制御性能を実現する。したがって、実施の形態に係る手法において、設計パラメータは参照モデルＭ、ＬＵＴにおいて各テーブルデータが格納されている場所の位置座標、及びＮＬＭＳの学習率μである。

［３．シミュレーションによる検討］
［３．１．システムの定式化］
シミュレーションを実行するための制御対象Ｐ、ＦＲＩＴの参照モデルＭ（ｓ）、制御器Ｃの制御パラメータθの定式化を行う。

制御対象は次式（２１）に示すように１次遅れシステムとした。

ここで、ａはシステムの応答に関するパラメータであり、システムの出力に応じて変化する。また、参照モデルは次式（２２）に示すように１次遅れシステムとした。

ここで、τ_Ｍはシステムの応答に関するパラメータであり、制御対象Ｐの先見情報等を勘案して定める。

［３．２．シミュレーション］
サンプリング時間は８ｍｓとし、離散化はゼロ次ホールドを用いた。パラメータａは制御対象の出力に応じて変化させた。

図３（ａ）−（ｆ）は、２次元の場合のＬＵＴの自動チューニングの前後におけるＬＵＴの形状を模式的に示す図である。具体的には、図３（ａ）−（ｃ）は、それぞれＬＵＴの自動チューニング前の比例ゲインＫ_ｐ、積分ゲインＫ_ｉ、及び微分ゲインＫ_ｄのＬＵＴの形状を示している。図３（ａ）−（ｃ）に示すＬＵＴの例では、自動チューニング前の各ＬＵＴは入力の状態にかかわらず一定値（初期値）が出力される。

図３（ｄ）−（ｆ）は、それぞれＬＵＴの自動チューニング後の比例ゲインＫ_ｐ、積分ゲインＫ_ｉ、及び微分ゲインＫ_ｄのＬＵＴの形状を示している。図３（ｄ）−（ｆ）に示すように、各ＬＵＴは、２つの入力（状態１及び状態２）と、一つの出力とが紐付けられている。

図４（ａ）−（ｂ）は、図２に示す閉ループ系において、ステップ入力を目標値としたときのシミュレーション結果を示す図である。図４（ａ）−（ｂ）における横軸は時間、縦軸は参照軌道（実線）と応答（一点鎖線）である。

具体的には、図４（ａ）は１回目のステップ入力における参照軌道と応答とを示すグラフであり、図４（ｂ）は、２０回目のステップ入力における参照軌道と応答とを示すグラフである。図４（ａ）−（ｂ）より、任意の初期パラメータでは参照軌道と応答の誤差が大きいが、ステップ応答が２０回目のときには参照軌道と応答がほぼ一致しており、図上では区別がつかない。これより、実施の形態に係る手法は、最適なＬＵＴが自動的に得られていると考えられる。すなわち、実施の形態に係る手法は、ゆるやかな経年変化に対応できるといえる。

なお、評価関数値に関して、実施の形態に係る手法は従来手法に対して約７％にまで低減した。これより、最適化したＬＵＴを用いた制御の効果の高さを確認できる。以上の結果から、実施の形態に係る手法はオンラインでＬＵＴを自動最適化できることがわかった。すなわち、実施の形態に係る手法は、人の手によるパラメータ調整に頼らずに最適な制御器Ｃの制御パラメータθの決定や、ＬＵＴの経年変化への対応が可能になったといえる。

＜実施の形態に係る情報処理装置１の機能構成＞
以上の技術を前提として、実施の形態に係る情報処理装置１を説明する。

図５は、実施の形態に係る閉ループ系を模式的に示す図であり、制御モデルを用いずに自動調整則を有するゲインスケジュールＰＩＤ制御を実現するための構成を示す図である。図５に示すように、実施の形態に係る情報処理装置１は、制御対象Ｐへの入力ｕ、制御対象の出力ｙ、制御対象Ｐの状態Ｘ、参照モデルＭの出力Ｍ（ｓ）ｒを取得して、ゲインスケジュール制御を実現するためのＬＵＴを更新するとともに、制御器Ｃの制御パラメータθを出力する。図５から明らかなように、実施の形態に係る閉ループ系は、図２に示した参照モデルを備える一般的な閉ループ系に情報処理装置１が追加されて構成されている。

図６は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図６において、矢印は主なデータの流れを示しており、図６に示していないデータの流れがあってもよい。図６において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図６に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報、制御対象Ｐの状態と制御器Ｃの制御パラメータθとを紐づけて格納するＬＵＴを格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによって状態取得部３０、パラメータ取得部３１、及びテーブル変更部３２として機能する。

なお、図６は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

前提技術の［２・１・１］節で説明したように、実施の形態に係る情報処理装置１は、図５における制御器Ｃの制御パラメータθを算出する。すなわち、情報処理装置１は、制御器Ｃと、制御器Ｃの出力を入力とする制御対象Ｐと、制御対象Ｐに入力する入力信号を入力として制御対象Ｐの出力をモデル化する参照モデルＭを備え、制御対象Ｐの出力が制御器Ｃの入力にフィードバックされる制御システムＳにおいて、制御器Ｃの制御パラメータθを算出する。また、情報処理装置１は、制御器Ｃの制御パラメータθを算出するために用いられるＬＵＴのテーブルデータも変更する。

前提技術の［２．１］節で説明したように、記憶部２が格納するＬＵＴは、制御対象Ｐに関する１又は複数の状態を軸とし、軸によって定義される空間に制御器Ｃの制御パラメータθが配置して格納している。

状態取得部３０は、制御対象Ｐの状態Ｘを取得する。前提技術の［２．１］節で説明したように、制御対象Ｐの状態Ｘとは、例えば、制御対象Ｐの温度や圧力、制御対象Ｐが運動を行う場合はその速度や運動量、制御対象Ｐが存在する環境のパラメータ（温度や湿度等）である。

パラメータ取得部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに基づいて、ＬＵＴを参照して制御器Ｃの制御パラメータθを取得する。具体的には、パラメータ取得部３１は、前提技術の［２．１］節で説明した式（１）又は式（３）に基づいて、制御器Ｃの制御パラメータθを算出することによって取得する。これにより、情報処理装置１は、制御対象Ｐの速い特性変動に関して迅速に制御パラメータθを取得することができる。

テーブル変更部３２は、制御対象Ｐの出力と、参照モデルＭの出力との誤差に関する評価関数Ｊに基づいて、ＬＵＴに配置するテーブルデータである制御パラメータθを変更する。具体的には、テーブル変更部３２は、前提技術の［２．１．１］節で説明した式（５）に示す評価関数Ｊが小さくなるように、ＬＵＴに配置するテーブルデータを変更する。これにより、情報処理装置１は、経年劣化が原因で制御対象Ｐの特性が変動しても、ＬＵＴに格納すべきテーブルデータである制御パラメータθをオンラインで自動的に調整することができる。

ここで、上述したように、ＬＵＴに配置するテーブルデータの変更は、制御対象Ｐの経年劣化等に対応するための処理である。したがって、テーブル変更部３２が常に可動している必要は必ずしもない。むしろ、制御の安定性を考慮した場合、ＬＵＴに配置するテーブルデータはむやみに変更すべきではない。

そこで、テーブル変更部３２は、式（５）に示す評価関数Ｊの評価値が所定の範囲から外れた場合に、評価関数Ｊの評価値が所定の範囲に含まれるようにＬＵＴに配置するテーブルデータである制御パラメータθを変更する。

ここで「所定の範囲」とは、ＬＵＴの変更の必要性の有無を決定するためにテーブル変更部３２が参照する「ＬＵＴ変更決定用範囲」である。具体的には、式（５）に示す評価関数Ｊは評価値が小さいほど良い評価となるため、所定の範囲は０〜上限値の範囲となる。すなわち、テーブル変更部３２は、評価関数Ｊの評価値が上限値を超えた場合、評価関数Ｊの評価値が上限値を下回るように、ＬＵＴに配置するテーブルデータを変更する。この上限値の具体的な値は、制御対象Ｐに関する先見情報や、制御に求められる精度等を勘案して実験により定めればよい。これにより、情報処理装置１は、不必要なＬＵＴの変更処理に計算リソースが割り当てられることを抑制できるとともに、制御器Ｃによる制御対象Ｐの制御の安定性を維持することができる。

前提技術の［２．２．２］節の式（１４）に示すように、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅは、ＬＵＴに配置すべきテーブルデータである制御パラメータθを要素とするパラメータベクトルｗ（式（１５））に対して線形となるように定義されている。

そこで、テーブル変更部３２は、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅが小さくなるように、式（１５）に示すパラメータベクトルｗを逐次更新することにより、ＬＵＴに配置すべき制御パラメータθを変更する。

より具体的には、テーブル変更部３２は、式（１８）〜式（２０）に示す更新式に基づいて、パラメータベクトルｗを逐次更新する。式（１８）〜式（２０）に示す更新式はＮＬＭＳ法の更新式である。一般に、ＮＬＭＳ法は、一般的な逐次最小二乗法と比較して安定性が高いものの収束時間が長い傾向にある。しかしながら、ＬＵＴに配置するテーブルデータの変更は制御対象Ｐの経年劣化等に対応するための処理であるため、収束時間が長いことは問題となりにくい。

このように、テーブル変更部３２がＮＬＭＳ法を用いて評価関数Ｊの評価値が小さくなるようにパラメータベクトルｗを逐次更新することにより、情報処理装置１は、制御器Ｃにより制御対象Ｐの制御の安定性を維持することができる。

前提技術の［２．１］節の式（１）又は式（３）に示すように、パラメータ取得部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに対応するＬＵＴの位置座標における制御パラメータθを、位置座標の近傍に配置された制御パラメータθの線形近似として算出する。このように、パラメータ取得部３１がＬＵＴのテーブルデータから制御パラメータθを線形演算で算出することにより、最終的に式（１４）に示すように、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅをＬＵＴのテーブルデータに対して線形とすることができる。

＜情報処理装置１が実行する情報処理の処理フロー＞
図７は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

状態取得部３０は、制御対象Ｐの状態Ｘを取得する（Ｓ２）。パラメータ取得部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに基づいて、ＬＵＴを参照して制御器Ｃの制御パラメータθを取得する（Ｓ４）。

テーブル変更部３２は、評価関数Ｊの評価値を算出して取得する（Ｓ６）。評価値が所定の範囲から外れている場合（Ｓ８のＮｏ）、テーブル変更部３２は、評価関数Ｊの評価値が所定の範囲に含まれるように、ＬＵＴに格納する制御パラメータθを変更する（Ｓ１０）。評価値が所定の範囲内の場合（Ｓ８のＹｅｓ）、又はテーブル変更部３２がＬＵＴを変更すると、本フローチャートにおける処理は終了する。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、非線形な特性を持つ制御対象に対して所望の制御性能を得られるとともに、経年劣化等による制御対象の特性変動に対応可能な制御器の制御パラメータの自動調整手法を提供することができる。

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。

＜第１の変形例＞
上記では、評価関数Ｊが式（９）に示す式から構成される場合について説明したが、評価関数Ｊを構成する式の形は式（９）に限定されない。この他、評価関数Ｊを構成する式の形は、以下に示す式（２３）又は式（２４）であってもよい。

ここで、Ｌ（s）はフィルタである。

式（２３）及び式（２４）は、いずれもプラントモデルを用いずに参照応答と実応答の誤差を小さくする制御器パラメータを最適化することを目的としている。評価関数が制御器パラメータに対して線形で表すことができれば、これらの評価関数以外にも適用可能である。特に式（２４）は、ＶＲＦＴ（Virtual Reference Feedback Tuning）として知られている。

＜第２の変形例＞
上記では、テーブル変更部３２がＮＬＭＳ法を用いてパラメータベクトルｗを逐次更新する場合について説明した。しかしながら、テーブル変更部３２が採用する最適化手法は、ＮＬＭＳ法に限られない。例えば、テーブル変更部３２は、最急降下法や共益勾配法等のＮＬＭＳ法以外の他の最適化手法を用いてパラメータベクトルｗを更新してもよい。

１・・・情報処理装置
２・・・記憶部
３・・・制御部
３０・・・状態取得部
３１・・・パラメータ取得部
３２・・・テーブル変更部
Ｃ・・・制御器
Ｐ・・・制御対象
Ｍ・・・参照モデル

Claims

制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象に関する１又は複数の状態を軸とし、前記軸によって定義される空間に前記制御器の制御パラメータが配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記制御パラメータを取得するパラメータ取得部と、
前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数に基づいて、前記ルックアップテーブルに配置する前記制御パラメータを変更するテーブル変更部と、
を備える情報処理装置。
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項１に記載の情報処理装置。
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置すべき前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを逐次更新することにより、前記制御パラメータを変更する、
請求項１又は２に記載の情報処理装置。
前記評価関数は、（１）前記空間において前記制御パラメータを配置すべき位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、（２）前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、ＮＬＭＳ（Normalized Least Mean Square）法を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを逐次更新する、
請求項３に記載の情報処理装置。
前記パラメータ取得部は、前記状態取得部が取得した状態に対応する前記空間の位置座標における前記制御パラメータを、前記位置座標の近傍に配置された前記制御パラメータの線形近似として算出する、
請求項１から４のいずれか１項に記載の情報処理装置。