JP2022181936A

JP2022181936A - 情報処理装置

Info

Publication number: JP2022181936A
Application number: JP2021089182A
Authority: JP
Inventors: 修一矢作; Shuichi Yahagi
Original assignee: Isuzu Motors Ltd
Current assignee: Isuzu Motors Ltd
Priority date: 2021-05-27
Filing date: 2021-05-27
Publication date: 2022-12-08

Abstract

【課題】制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供する。【解決手段】フィードバック制御システムにおいて、制御器の制御パラメータを算出する情報処理装置は、制御対象あるいは外部入力に関する１又は複数の状態を軸とし、軸によって定義される空間に制御パラメータを算出するために用いられる複数のパラメータ値が配置されているルックアップテーブルと、制御対象の状態を取得する状態取得部と、状態取得部が取得した状態に基づいて、ルックアップテーブルを参照して複数のパラメータ値に基づいて制御パラメータを生成するパラメータ生成部と、制御対象の出力と、参照モデルの出力との誤差に関する評価関数についてのＬＡＳＳＯ回帰の結果に基づいて、ルックアップテーブルに配置する複数のパラメータ値を変更するテーブル変更部と、を備える。【選択図】図７

Description

本開示は、情報処理装置に関する。

産業システムの閉ループ制御の大半は直感的に理解できるＰＩＤ制御が用いられている。線形性の強い制御対象であれば所望の制御性能が得られるが、非線形システムの場合、ゲインが固定されたＰＩＤ制御で十分な制御性能を得ることは難しい。非線形制御理論やモデルベース制御の適用も考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きいため非線形制御適用のハードルが高い。また，産業システムは複雑であり精度の高いモデルを得ることが難しい場合が多く、モデルベース制御の効果が十分に発揮できない場合がある。このような背景から、産業界ではルックアップテーブル（Look-up table:以下「ＬＵＴ」と記載する)を用いたゲインスケジュールＰＩＤ制御がよく用いられる（例えば、特許文献１を参照）。

ゲインスケジュール制御は制御対象の状態に応じて制御器パラメータを変更し、所望の制御性能を実現する手法である。このような考え方は直観的に理解しやすく産業界では受け入れやすい。その反面，所望の制御性能を得るために大量の制御パラメータを事前に調整する必要がある。固定ＰＩＤ制御であれば調整パラメータは比例ゲイン、積分ゲイン、微分ゲインの３つであるが、ＬＵＴを用いたゲインスケジュール制御の場合、はるかに大きな数のパラメータを調整しなくてはならず、パラメータ調整に多くの時間を要している。近年，システム同定を介することなく制御対象モデルを用いない制御系設計法が注目されている．オフラインで取得したデータから最適制御パラメータを求める手法として、ＶＲＦＴ（Virtual Reference Feedback Tuning）（例えば、特許文献２を参照）やＦＲＩＴ（Fictitious Reference Feedback Tuning）が提案されている。

ＶＲＦＴやＦＲＩＴといったデータ駆動制御は、繰り返し実験を行うことなく一組の入出力データからオフラインで制御器パラメータが得られるという点で注目されている。以上のような制御対象のモデルを用いない制御手法は、プロセス系や自動車システム等の産業システム，振動制御問題への適用も進められている。これまで、非線形システムに対するデータ駆動制御手法の検討もされているが、ＬＵＴパラメータの自動調整法に対しての検討はされていない。

特開２０１２－１１３６７６号公報特開２０２１－４３５７３号公報

ところで、固定ＰＩＤゲインを求める一般的なＶＲＦＴでは、制御対象の状態に応じて制御パラメータが変化しないため、ＰＩＤゲインが目標応答に十分に追従できないという問題もある。

本開示はこれらの点に鑑みてなされたものであり、制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供することを目的とする。

上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象または外部入力に関する１又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのＬＡＳＳＯ回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。

前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成してもよい。

前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じてもよい

前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更してもよい。

前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更してもよい。

前記評価関数は、（１）前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、（２）前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、前記テーブル変更部は、ＬＡＳＳＯ回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更してもよい。

本開示によれば、制御対象の状態に応じて制御パラメータを変化させることができる。

図１は、参照モデルを備える閉ループ系を模式的に示す図である。図２は、ゲインスケジュールＰＩＤ制御のシステム構成を模式的に示す図である。図３は、二次元で構成されるＬＵＴを示す図である。図４は、ゲインスケジューラの構成を示す図である。図５は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。図６は、実施の形態に係る閉ループ系を模式的に示す図である。図７は、実施の形態に係る情報処理装置の機能構成を模式的に示す図である。図８は、実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。図９は、取得した入出力データから固定ＰＩＤゲインを求めたときの時系列データを示す図である。図１０は、本開示の手法でＰＩＤゲインを求めたときの時系列データを示す図である。図１１Ａは、制御対象の状態１および状態２のそれぞれに応じて変化する比例ゲインを示す図である。図１１Ｂは、制御対象の状態１および状態２のそれぞれに応じて変化する積分ゲインを示す図である。図１１Ｃは、制御対象の状態１および状態２のそれぞれに応じて変化する微分ゲインを示す図である。

＜実施の形態の前提となる技術＞
本開示の実施の形態を説明する前に、まず、本開示の実施の形態が前提とする前提技術について説明する。

［緒言］
現在、産業界において、閉ループ制御の大半はＰＩＤ制御が用いられている。これは、ＰＩＤ制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。

ＬＵＴを用いたゲインスケジュール制御は、あらかじめ制御対象の状態と制御器の制御パラメータの生成に用いられるパラメータ値とを紐づけて格納するＬＵＴを参照することにより制御対象の状態に応じて制御器の制御パラメータを変更し、所望の制御性能を実現する手法である。このため、ＬＵＴを用いたゲインスケジュール制御はマップベース制御と呼ばれることもある。

ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにＬＵＴを事前に調整する必要がある。通常のＰＩＤ制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの３つである。一方、ゲインスケジュール制御はＬＵＴを用意する必要があるため、通常のＰＩＤ制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。

そこで、本開示では、ゲインスケジュールＰＩＤ制御のスケジューリング関数（スケジューラ）であるＬＵＴパラメータを自動調整する方法を提案する。以下に、スケジューリング関数をＬＵＴで表す。次に、ゲインスケジュールＰＩＤ制御器を定義する。次に、ゲインスケジュールＰＩＤ制御器を対象としたＶＲＦＴの評価関数を導出する。次に、評価関数が最小となるようにＬＡＳＳＯ（least absolute shrinkage and selection operator）回帰により最適制御パラメータを求める。これにより、試行錯誤的なパラメータ調整や、システム同定が不要となる。

以下の説明においては、先ず、準備としてＶＲＦＴとゲインスケジュールＰＩＤ制御について説明する。次に、問題設定について説明する。次に、ＶＲＦＴを利用したゲインスケジュール制御パラメータの自動調整について説明する。次に、シミュレーション検証について説明する。

［ＶＲＦＴ］
ＶＲＦＴは、開ループの入出力データからシステム同定を介さず、直接的に、制御パラメータを求める手法である。最適制御パラメータは参照モデルと閉ループ系が同じ特性となるように調整される。図１にＶＲＦＴの構造について示す。図１は、参照モデルを備える閉ループ系を模式的に示す図である。Ｃは制御器、Ｍは参照モデル、Ｐは制御対象（プラント）であり、ｕは入力、ｙは出力である。また、ρは制御器パラメータ、ｚはシフトオペレータである。ｒバー（ｔ）はＶＲＦＴで提案されている仮想参照入力、ｅバー（ｔ）は、ＶＲＦＴで提案されている仮想誤差である。

ＶＲＦＴの手順について簡単に説明する。
ステップ１：希望する閉ループの参照モデルをＭｄとする。また、制御対象の入出力データをｕ（ｔ），ｙ（ｔ），ｔ＝１，．．．，Ｎとする。
ステップ２：ｙ（ｔ）を参照モデルの出力とみなすと、ｙ（ｔ）を発生する仮想の参照入力は次式のように決められる。なお、参照入力を「参照信号」または「疑似参照信号」ともいう。

ステップ３：この参照信号ｒバー（ｔ）を図１の閉ループの参照入力と考える。このとき制御器で作られる操作量は、これを仮想操作量とすると、次式になる

ステップ４：この仮想操作量ｕバー（ｔ）と操作量ｕ（ｔ）のデータが近づけば、コントローラをもつ閉ループは参照モデルに近いとみなせる。すなわち、最小化する評価関数は次式になる。

式（１），（２）により、上式は次のようになる。

ステップ５：プレフィルタＬの導入
式（４）の項には、参照モデルＭｄの逆行列がありノンプロパーである。式（３４）に示すプレフィルタの追加によりノンプロパーを回避する。このプレフィルタを式（４）に追加すると式（５）が得られる。

ここで、

［ゲインスケジュールＰＩＤ制御］
図２は、ゲインスケジュールＰＩＤ制御のシステムを示す図である。図２に示すように、ゲインスケジュールＰＩＤ制御のシステムは、制御対象Ｐと、制御器Ｃ（ｚ，ρ）、可変な制御器パラメータρ、有理関数ベクトルψ（ｚ）、スケジューリング関数ｆ（ｘ）により構成される。
図２に示す制御器Ｃ（ｚ，ρ）は、次式で記述される。

ここで、

制御パラメータρは、スケジューリング関数ｆ（ｘ）に応じてゲインスケジュールされる。ｗ_iは、ｉ番目のスケジューリング関数のパラメータベクトルである。

［ルックアップテーブルの構造］
図３に、２次元の場合のグリッドベースルックアップテーブル（Grid-Based Look-up Table）の構成を示す。図３に示すｘ１，ｘ２は、ＬＵＴへの入力、Ｃ_ｌ，ｋ，Ｃ_{１，ｋ＋１}，Ｃ_２，１、Ｃ_{２，ｌ＋１}は、補間ノード、θ_ｋ，ｌ，θ_{ｋ＋１，ｌ}，θ_{ｋ、ｌ＋１}，θ_{ｋ＋１，ｌ＋１}は、テーブルデータ（ＬＵＴのパラメータ値）である。このとき、ＬＵＴへ入力が与えられときのＬＵＴからの出力ｗ_ＬＵは次式となる。

ここで、

図４は、ゲインスケジューラの構成を示す図である。図４に示すように、ＬＵＴから出力される複数のパラメータが重み付け加算された値が制御パラメータとなる。

重みは、状態量に近いテーブルデータの影響が大きく、状態量から遠いテーブルデータの影響を小さくするように、状態量と各ノードの面積Ａが利用される。

式（１０）に一般化基底関数φを導入するとサイスＭ_１×Ｍ_２のマップの出力は次式で表せる。なお、基底関数は、公知のルックアップテーブルで示されるか、簡単な計算により求められる。

なお、図３に示すＬＵＴは、状態１に対応する軸と状態２に対応する軸とを有する二次元のＬＵＴであるが、ＬＵＴは１つの状態に対応する１つの軸のみを有する一次元のＬＵＴであってもよく、３つ以上の状態に対応する三次元以上のＬＵＴであってもよい。

［モデル参照制御］
図５は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。図５に示すように、目標値ｒから出力ｙまでの入出力特性が、予め設定された参照モデルＭｄに一致するようなゲインスケジューラを構成するｎ個のパラメータベクトルｗを自動で調整する場合に、次の評価関数Ｊ_ＭＲを最小にするゲインスケジュールの最適パラメータを得ることを目的とする。

ここで、ｗはスケジューリング関数ｆ（ｘ）を構成するパラメータベクトルである。

［ゲインスケジュール制御パラメータの自動調整］
ここで、制御器は、例えば、速度型ＰＩＤ制御器とする。２次元ＬＵＴをゲインスケジューラとして用いると、ゲインスケジュールＰＩＤ制御は次式で表される。なお、ＰＩＤ制御器を速度型ＰＩＤ制御器とするが、本開示は速度型ＰＩＤ制御器に限定されない。

ここで、

である。ρは制御器の制御パラメータ、Ｋｐは比例ゲイン、Ｋｉは積分ゲイン、Ｋｄは微分ゲインである。また、ｆ_ｐは比例ゲインに関するＬＵＴ、ｆ_ｉは積分ゲインに関するＬＵＴ、ｆ_ｄは微分ゲインに関するＬＵＴである。ｗ^Ｋｐ、ｗ^Ｋｉ、ｗ^Ｋｄは、それぞれ比例ゲイン、積分ゲイン、微分ゲインに関するゲインスケジューラのパラメータベクトルである。φ（チルダ）は、式（１２）に示した一般化基底関数を要素とする既知ベクトルであり、ＬＵＴにおいて各テーブルデータが格納されている場所の位置座標を用いて計算される。また、式中「Ｔ」はベクトルの転置を表す。

式（５）に式（１３）を代入し，式を整理すると、評価関数は次式が得られる。

ここで、

ここで、パラメータベクトルｗ、ベクトルξ，及び、ベクトルｄのそれぞれは、以下の式（２７）、式（２８）及び式（２９）で表される。

式（２６）～式（２９）に示すように、フィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差ｅ_ＬＵＴ（ｔ）は、ＬＵＴのテーブルデータから構成されるパラメータベクトルｗに関して線形で表せる。

式（２９）より、ξ（ｔ）は、ＬＵＴにおいて各テーブルデータが格納されている場所の位置座標、参照モデルＭｄ、及び、制御対象Ｐの出力ｙ（ｔ）を用いて算出できる。また、式（２７）より、ｄ（ｔ）は、制御対象Ｐの入力ｕ（ｔ）（すなわち制御器Ｃの出力）を用いて算出できる。

式（２５）および式（２６）から、評価関数Ｊは、（１）ＬＵＴにおいてテーブルデータを配置すべき位置座標、参照モデルＭｄ、及び制御対象Ｐの出力ｙから算出されるベクトルξと、ＬＵＴのテーブルデータを要素とするパラメータベクトルｗとの内積と、（２）制御対象Ｐの入力信号ｕを用いて算出された値の積との差の二乗で定義される。

［最適化手法］
上述したように、評価関数はパラメータベクトルｗに関して線形であるため、最小二乗法を用いると、最適解は次式で求められる。

ここで、

最小二乗法を適用した場合、非常に局所的にＬＵＴのパラメータを求めることになり、そのパラメータと隣り合うパラメータとの差が極端に大きくなる場合がある。これは、ＰＩＤゲインが急変し、閉ループ系が不安定になることにつながる。本開示では、一般化ＬＡＳＳＯを導入することで、互いに隣り合うパラメータの差の大きさに対しＬ^１ノルムを導入する。
一般化ＬＡＳＳＯを取り入れた評価関数は次式で表される。

λは設計パラメータであって、クロスバリデーション（Cross-validation）等の公知の手法により適切な値が求められる。また、クロスバリデーションにより、制御対象の入出力データ数が少ない場合や、制御対象の状態が急激に変化した場合でも、過学習が防止されるため、パラメータの局所的な最適化を防止できる。

［アルゴリズム］
ＶＲＦＴを用いたＰＩＤゲインのスケジューリング関数の重み係数（制御パラメータ）の自動調整アルゴリズムについて説明する。
ステップ１：開ループ系で入出力データを計測する。
ステップ２：参照モデルを設定する。
ステップ３：スケジューリングパラメータの候補を決定し、ＰＩＤゲインそれぞれのスケジューリング関数を設計する。
ステップ４：プレフィルタを設計する。
ステップ５：評価関数を最小にするスケジューリング関数の重み係数（制御パラメータ）をＬＡＳＳＯ回帰で求める。
なお、ステップ４において、たとえば、シミュレーションおよび実験にて実績のある次式のプレフィルタを用いる。ただし、プレフィルタはこれに限らない。

［シミュレーション検証］
非線形システムを制御対象とした。ここでは、非線形システムを記述するモデルとして広く用いられているHammerstein モデルを制御対象とした。
制御器を含めたシミュレーションのサンプリング周期は１（ｓｅｃ）とし、次式に示すようなHammerstein モデルを制御対象とした。

ここで、ｖは分散１×１０^－３の白色雑音とする。各時刻の目標値ｒを以下のように設定した。

参照モデルは次式を用いた。

スケジューリングパラメータを次式とした。

ゲインスケジューラは、式（９）を用いた。

［検証結果］
入力はチャープサイン信号を印加し、入出力データを計測した。
従来の手法である標準ＶＲＦＴ（固定ＰＩＤゲイン）を用いたときの時系列データと、本開示の手法であるＬＵＴ－ＶＲＦＴ－ＬＡＳＳＯを用いたとときの時系列データとを比較した。
従来の手法で求められた固定ＰＩＤゲインは、Ｋ_ｐ＝０．０３８９、Ｋ_ｉ＝０．２２３２、Ｋ_ｄ＝０．００００である。取得した入出力データから固定ＰＩＤゲインを求めたときの時系列データを図９に示す。また、本開示の手法でＰＩＤゲインを求めたときの時系列データを図１０に示す。なお、図９および図１０のそれぞれにおいて、上段から、出力、入力、比例ゲイン、積分ゲイン、微分ゲインである。
図９および図１０を参照して、従来の手法と本開示の手法とを比較すると、本開示の手法は、ＰＩＤゲインが制御対象の状態に応じて変化しており、ＰＩＤゲインが目標応答に追従していることが確認できた。

また、本開示の手法における、制御対象の状態と比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれとの関係を図１１Ａ－図１１Ｃに示す。なお、図１１Ａ－図１１Ｃのそれぞれにおいて、ｓｔａｔｅ１軸は状態１の数量を表し、ｓｔａｔｅ２軸は状態２の数量を表す。縦軸は比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれを表す。
図１１Ａ－図１１Ｃを参照すると、制御対象の状態１および状態２のそれぞれに応じて比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれが変化していることが確認できた。

＜実施の形態に係る情報処理装置１の機能構成＞
以上の技術を前提として、実施の形態に係る情報処理装置１を説明する。

図６は、実施の形態に係る閉ループ系を模式的に示す図であり、制御モデルを用いずに自動調整則を有するゲインスケジュールＰＩＤ制御を実現するための構成を示す図である。図６に示すように、実施の形態に係る情報処理装置１は、制御対象Ｐへの入力ｕ、制御対象の出力ｙ、制御対象Ｐの状態Ｘ、参照モデルＭの出力Ｍ（ｚ^－１）ｒを取得して、ゲインスケジュール制御を実現するためのＬＵＴを変更するとともに、制御器Ｃの制御パラメータρを出力する。図６から明らかなように、実施の形態に係る閉ループ系は、図１に示した参照モデルを備える一般的な閉ループ系に情報処理装置１が追加されて構成されている。

図７は、実施の形態に係る情報処理装置１の機能構成を模式的に示す図である。情報処理装置１は、記憶部２と制御部３とを備える。図７において、矢印は主なデータの流れを示しており、図７に示していないデータの流れがあってもよい。図７において、各機能ブロックはハードウェア（装置）単位の構成ではなく、機能単位の構成を示している。そのため、図７に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。

記憶部２は、情報処理装置１を実現するコンピュータのＢＩＯＳ（Basic Input Output System）等を格納するＲＯＭ（Read Only Memory）や情報処理装置１の作業領域となるＲＡＭ（Random Access Memory）、ＯＳ（Operating System）やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報、制御対象Ｐの状態と制御器Ｃの制御パラメータρとを紐づけて格納するＬＵＴを格納するＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等の大容量記憶装置である。

制御部３は、情報処理装置１のＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等のプロセッサであり、記憶部２に記憶されたプログラムを実行することによって状態取得部３０、パラメータ生成部３１、及びテーブル変更部３２として機能する。

なお、図７は、情報処理装置１が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置１は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部３を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。

［ゲインスケジュールＰＩＤ制御］節で説明したように、実施の形態に係る情報処理装置１は、図６における制御器Ｃの制御パラメータρを算出する。すなわち、情報処理装置１は、制御器Ｃと、制御器Ｃの出力を入力とする制御対象Ｐと、制御対象Ｐに入力する入力信号を入力として制御対象Ｐの出力をモデル化する参照モデルＭを備え、制御対象Ｐの出力が制御器Ｃの入力にフィードバックされる制御システムにおいて、制御器Ｃの制御パラメータρを算出する。また、情報処理装置１は、制御器Ｃの制御パラメータρを算出するために用いられるＬＵＴのテーブルデータであるパラメータ値も変更する。

［ルックアップテーブルの構造］節で説明したように、記憶部２が格納するＬＵＴは、制御対象Ｐに関する１又は複数の状態を軸とし、軸によって定義される空間に制御器Ｃの制御パラメータρが配置されて格納されている。

状態取得部３０は、制御対象Ｐの状態Ｘを取得する。制御対象Ｐの状態Ｘとは、例えば、制御対象Ｐの温度や圧力、制御対象Ｐが運動を行う場合はその速度や運動量、制御対象Ｐが存在する環境のパラメータ（温度や湿度等）である。状態取得部３０により取得されたデータは記憶部２に蓄積され、蓄積されたデータは、パラメータ生成部３１により用いられる。これにより、ＬＵＴのパラメータはテーブル変更部３２によりオフライン調整される。なお、状態取得部３０により取得されたデータがリアルタイムで用いられることで、ＬＵＴのパラメータがテーブル変更部３２によりオンライン調整されてもよい。

パラメータ生成部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに基づいて、ＬＵＴを参照して複数のパラメータ値θｉ，ｊに基づいて制御パラメータρを生成する。具体的には、パラメータ生成部３１は、式（８）又は式（１３）に基づいて、複数のパラメータ値θｉ，ｊのそれぞれに、複数のパラメータ値θｉ，ｊのそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより制御パラメータρを生成する。パラメータ生成部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘと複数のパラメータ値θｉ，ｊが対応する状態との距離ｄが近ければ近いほど大きな値の重みを複数のパラメータ値θi、ｊに乗じる。これにより、情報処理装置１は、制御対象Ｐの速い特性変動に応じて制御パラメータρを生成することができる。

テーブル変更部３２は、制御対象Ｐの出力と、参照モデルＭの出力との誤差に関する評価関数Ｊに基づいて、ＬＵＴに配置するテーブルデータである複数のパラメータ値θｉ，ｊを変更する。具体的には、テーブル変更部３２は、式（１３）に示す評価関数Ｊが小さくなるように、ＬＵＴに配置する複数のテーブルデータを変更する。これにより、情報処理装置１は、たとえば、経年劣化が原因で制御対象Ｐの特性が変動しても、ＬＵＴに格納すべきテーブルデータである複数のパラメータ値θｉ，ｊを自動的に調整することで、制御パラメータを最適な値に調整することができる。

ここで、ＬＵＴに配置するテーブルデータの変更は、制御対象Pの状態に対応して行われる。たとえば、制御対象Ｐの経年劣化等に対応してテーブルデータの変更が行われる。

そこで、テーブル変更部３２は、式（１３）に示す評価関数Ｊの評価値が所定の範囲から外れた場合に、評価関数Ｊの評価値が所定の範囲に含まれるようにＬＵＴに配置するテーブルデータである複数のパラメータ値θｉ，ｊを変更する。

ここで「所定の範囲」とは、ＬＵＴの変更の必要性の有無を決定するためにテーブル変更部３２が参照する「ＬＵＴ変更決定用範囲」である。具体的には、式（１３）に示す評価関数Ｊは評価値が小さいほど良い評価となるため、所定の範囲は０～上限値の範囲となる。すなわち、テーブル変更部３２は、評価関数Ｊの評価値が上限値を超えた場合、評価関数Ｊの評価値が上限値を下回るように、ＬＵＴに配置するテーブルデータを変更する。この上限値の具体的な値は、制御対象Ｐに関する先見情報や、制御に求められる精度等を勘案して実験により定めればよい。これにより、情報処理装置１は、不必要なＬＵＴの変更処理に計算リソースが割り当てられることを抑制できるとともに、制御器Ｃによる制御対象Ｐの制御の安定性を維持することができる。

式（２６）に示すように、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅは、ＬＵＴに配置すべきテーブルデータである複数のパラメータ値θｉ，ｊに基づく制御パラメータρを要素とするパラメータベクトルｗ（式（２８））に対して線形となるように定義されている。

そこで、テーブル変更部３２は、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅが小さくなるように、式（２８）に示すパラメータベクトルｗを変更することにより、ＬＵＴに配置すべき複数のパラメータ値θｉ，ｊを変更する。

より具体的には、テーブル変更部３２は、式（３３）に示す評価関数に基づいて、パラメータベクトルｗを変更する。式（３３）に示す式はＬＡＳＳＯ回帰を取り入れた評価関数の式である。一般に、ＬＡＳＳＯ回帰は、一般的な逐次最小二乗法と比較して過学習を防止することで、パラメータの局所的な最適化を防止できるという利点がある。

このように、テーブル変更部３２がＬＡＳＳＯ回帰の導入で評価関数Ｊの評価値が小さくなるようにパラメータベクトルｗを変更することにより、情報処理装置１は、制御器Ｃにより制御対象Ｐの制御の安定性を維持することができる。

パラメータ生成部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに対応するＬＵＴの位置座標からの距離に基づいて複数のパラメータ値θｉ，ｊを重み付け加算することにより制御パラメータρを算出する。このように、パラメータ生成部３１がＬＵＴのテーブルデータから制御パラメータρを線形演算で算出することにより、最終的に式（２６）に示すように、制御対象Ｐの出力と参照モデルＭの出力との誤差ｅをＬＵＴのテーブルデータに対して線形とすることができる。

＜情報処理装置１が実行する情報処理の処理フロー＞
図８は、実施の形態に係る情報処理装置１が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置１が起動したときに開始する。

状態取得部３０は、制御対象Ｐの状態Ｘを取得する（Ｓ１）。パラメータ生成部３１は、状態取得部３０が取得した制御対象Ｐの状態Ｘに基づいて、ＬＵＴを参照して制御器Ｃの制御パラメータρを生成する（Ｓ２）。

テーブル変更部３２は、評価関数Ｊの評価値を算出して取得する（Ｓ３）。評価値が所定の範囲から外れている場合（Ｓ４：ＮＯ）、テーブル変更部３２は、評価関数Ｊの評価値が所定の範囲に含まれるように、ＬＵＴに格納する制御パラメータρを変更する（Ｓ５）。その後、本フローチャートにおける処理は終了する。評価値が所定の範囲内の場合（Ｓ４：ＹＥＳ）、本フローチャートにおける処理は終了する。

＜実施の形態に係る情報処理装置１が奏する効果＞
以上説明したように、実施の形態に係る情報処理装置１によれば、制御対象の状態に応じて制御パラメータを変化させるように構成したため、ＰＩＤゲインが目標応答に十分に追従可能となる。

以上、本開示を実施の形態を用いて説明したが、本開示の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本開示の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。

その他、上記実施の形態は、何れも本開示の実施をするにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

本開示は、制御対象の状態に応じてパラメータを変化させることが要求される情報処理装置を備えた産業システム、特に、エンジンや自動変速機等の非線形性が強い産業システムに好適に利用される。

１情報処理装置
２記憶部
３制御部
３０状態取得部
３１パラメータ生成部
３２テーブル変更部
Ｃ制御器
Ｐ制御対象
Ｍ参照モデル

上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御器に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象または外部入力に関する１又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、取得された前記制御対象の状態を蓄積する記憶部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、蓄積された前記制御対象の状態を用いて、オフラインで、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのＬＡＳＳＯ回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。

Claims

制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象または外部入力に関する１又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、
前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのＬＡＳＳＯ回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、
を備える情報処理装置。
前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成する、
請求項１に記載の情報処理装置。
前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じる、
請求項２に記載の情報処理装置。
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項１から３のいずれか一項に記載の情報処理装置。
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更する、
請求項１から４のいずれか一項に記載の情報処理装置。
前記評価関数は、（１）前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、（２）前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、前記ＬＡＳＳＯ回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更する、
請求項５に記載の情報処理装置。