WO2014112074A1

WO2014112074A1 - プラント制御装置

Info

Publication number: WO2014112074A1
Application number: PCT/JP2013/050811
Authority: WO
Inventors: 真典嶋田
Original assignee: トヨタ自動車株式会社
Priority date: 2013-01-17
Filing date: 2013-01-17
Publication date: 2014-07-24
Also published as: JPWO2014112074A1; CN104937506A; US20150356413A1; JP5930074B2; DE112013006439T5

Abstract

　本発明に係るプラント制御装置によれば、リファレンスガバナは、制御出力の修正目標値候補に基づき、プラントとフィードバックコントローラとを含む閉ループ系がモデル化された予測モデルを用いて、制約が課せられた特定状態量を含むプラントの状態量の予測値を有限の予測ホライズンにわたって順次計算する。その際、ある修正目標値候補に関して特定状態量の予測値が制約に抵触した場合、リファレンスガバナは、当該修正目標値候補を最終的な修正目標値の対象から除外する。これにより、制約の充足性は担保されつつ制御出力の目標値の修正に要する演算負荷は低減される。

Description

プラント制御装置

　本発明は、プラントの制御装置に関し、詳しくは、プラントの状態量に課せられる制約が充足されるようにリファレンスガバナを用いてプラントの制御出力の目標値を修正する制御装置に関する。

　一般的なプラント制御装置は、プラントの制御出力に関して目標値が与えられた場合、同制御出力を目標値に追従させるようにフィードバック制御によってプラントの制御入力を決定するように構成されている。ただし、実際のプラントの制御においては、プラントの状態量に関してハード上或いは制御上の様々な制約が存在している場合が多い。それらの制約が充足されない場合、ハードの破損や制御性能の低下が生じるおそれがある。制約の充足性は、制御出力の目標値に対する追従性と同じく、プラントの制御において求められる重要な性能の１つである。

　リファレンスガバナは上記要求を満たすための１つの有効な手段である。リファレンスガバナは制御対象であるプラントとフィードバックコントローラとを含む閉ループ系（フィードバック制御システム）をモデル化した予測モデルを備え、制約が課せられている状態量の将来値を予測モデルによって予測する。そして、状態量の予測値とそれに課せられた制約とに基づいてプラントの制御量の目標値を修正する。

　リファレンスガバナをプラントの制御に適用した先行技術の例としては、下記の特許文献１に開示された先行技術を挙げることができる。この先行技術は多段圧延装置における圧延材の張力制御に関するものである。特許文献１に開示された先行技術では、圧延材の張力の時間変化を規定した目標軌道データがリファレンスガバナによって予め演算され、圧延材の張力実績値と目標軌道データとの偏差に基づいて圧延材の張力が制御される。

　上記公報に開示された発明では、リファレンスガバナによるオフライン計算が行われている。多段圧延装置における圧延材の張力の目標値は予め与えられているため、リファレンスガバナによる目標値の修正はオフラインで行うことができる。しかし、プラントの種類によっては、オフライン計算ではなくオンライン計算が必要とされる場合がある。自動車の動力装置として用いられる内燃機関はそのようなプラントの一種である。内燃機関では、運転条件によって刻々と目標値が変化することから、状態量に課せられた制約を満たすためにはオンライン計算による目標値の修正が必要となる。ところが、リファレンスガバナのオンライン計算に掛かる演算量は多大であるため、リファレンスガバナによるオンライン計算を制御装置に実装する場合、制御装置には多大な演算負荷がかかってしまう。

特開２０１０－２５３５０１号公報

　本発明は、上述のような課題に鑑みてなされたもので、プラントの状態量に課せられた制約が充足されるようにリファレンスガバナを用いて制御出力の目標値を修正するにあたり、制御装置にかかる演算負荷を低減することを目的とする。

　本発明に係るプラント制御装置はフィードバックコントローラとリファレンスガバナとを備える。フィードバックコントローラは、プラントの制御出力を目標値に近づけるようにフィードバック制御によってプラントの制御入力を決定するように構成される。制御対象であるプラントの種別や構成には限定はない。リファレンスガバナは、フィードバックコントローラに与えられる目標値を修正するように構成される。

　リファレンスガバナは、少なくとも予測モデル演算処理と評価関数演算処理と修正目標値決定処理とを実行することができる。予測モデル演算処理によれば、制御出力の修正目標値候補に基づき、プラントとフィードバックコントローラとを含む閉ループ系がモデル化された予測モデルを用いて、制約が課せられた特定状態量を含むプラントの状態量の予測値を有限の予測ホライズンにわたって順次計算することが行われる。評価関数演算処理によれば、予測モデル演算で得られた計算結果に基づき、予め定義された評価関数を用いて、修正目標値候補の評価値を計算することが行われる。修正目標値決定処理によれば、予測モデル演算処理と評価関数演算処理とを複数の修正目標値候補に関して実行し、複数の修正目標値候補のそれぞれの評価値に基づいて最終的な修正目標値を決定することが行われる。

　本発明に係るプラント制御装置では、リファレンスガバナは、ある修正目標値候補に関する予測モデル演算処理により予測された特定状態量の予測値が制約に抵触した場合、当該修正目標値候補を最終的な修正目標値の対象から除外する。このような機能をリファレンスガバナが備えることにより、リファレンスガバナによる目標値の修正に要する演算負荷は低減される。

　さらに、リファレンスガバナは、ある修正目標値候補に関する予測モデル演算処理の途中で特定状態量の予測値が制約に抵触した場合、当該修正目標値候補に関する予測モデル演算処理の残りの計算をキャンセルすることができる。このような機能をリファレンスガバナがさらに備えることにより、必要のない予測モデル演算処理は途中で打ち切られるようになって、その分、目標値の修正に要する演算負荷はさらに低減される。なお、リファレンスガバナにより実行される予測モデル演算処理では、予め設定された予測周期で離散的に状態量の予測値を計算することができる。この場合、上記機能によれば、ある修正目標値候補に関する予測モデル演算処理において最初の離散時刻から最終の離散時刻までの間の途中の離散時刻で特定状態量の予測値が制約に抵触したとき、残りの離散時刻における状態量の予測値の計算がキャンセルされる。

　リファレンスガバナにより実行される評価関数演算処理では、予測モデル演算処理で計算された各離散時刻における制御出力の予測値と制御出力の本来の目標値との距離が小さいほど望ましい評価値を与える評価関数を使用することができる。また、リファレンスガバナにより実行される修正目標値決定処理では、評価値が最も望ましい値となる修正目標値候補を最終的な修正目標値として決定することができる。

　リファレンスガバナにより実行される修正目標値決定処理では、予め定義された更新規則に従って修正目標値候補を更新することができる。好ましい更新規則によれば、前回の修正目標値候補の評価値に対する今回の修正目標値候補の評価値の変化の方向と、前回の修正目標値候補に対する今回の修正目標値候補の変化の方向との組み合わせによって次回の修正目標値候補が決定される。また、修正目標値候補を順次更新していくのであれば、好ましくは、前回の修正目標値候補の評価値に対して今回の修正目標値候補の評価値がより望ましい値であれば、今回の修正目標値候補を最終的な修正目標値として仮決定し、前回の修正目標値候補の評価値に対して今回の修正目標値候補の評価値がより望ましい値でなければ、前回仮決定した最終的な修正目標値をそのまま保持する。

本発明の実施の形態に係るプラント制御装置が適用されるディーゼルエンジンの後処理システムの構成を示す図である。本発明の実施の形態に係るプラント制御装置の目標値追従制御構造を示す図である。図２に示す目標値追従制御構造を等価変形した図である。本発明の実施の形態で採用されたリファレンスガバナのアルゴリズムを示すフローチャートである。本発明の実施の形態で採用されたリファレンスガバナによる予測モデル演算処理のイメージを示す図である。本発明の実施の形態で採用されたリファレンスガバナによる評価値の計算に使用されるマップの設定を示す図である。本発明の実施の形態で採用されたリファレンスガバナによる評価値演算処理のイメージを示す図である。本発明の実施の形態で採用されたリファレンスガバナによる修正目標値候補の更新規則を具体的に示した表である。本発明の実施の形態で採用されたリファレンスガバナの動作イメージを示す図である。

　以下、本発明の実施の形態について図を用いて説明する。

　本実施の形態に係る制御装置は、自動車に搭載されるディーゼルエンジン、より詳しくは、ディーゼルエンジンの後処理システムを制御対象プラントとする制御装置である。図１はディーゼルエンジンの後処理システムの構成を示す概略図である。後処理システムは、排気通路にＤＯＣ（ディーゼル酸化触媒）とＤＰＦ（ディーゼル微粒子除去装置）とを備え、シリンダヘッドの排気ポートに燃料添加弁を備えている。排気通路におけるＤＰＦの下流には、後処理システムの制御出力であるＤＰＦ温度（詳しくは、ＤＰＦの出口ガス温度）を計測するための温度センサが取り付けられている。

　本実施の形態に係る制御装置は、ＤＰＦ温度に課せられた各制約を満足させながら、ＤＰＦ温度を目標値に追従させるための制御構造を備えている。その制御構造が図２に示す目標値追従制御構造である。本実施の形態に係る目標値追従制御構造は、目標値マップ（ＭＡＰ）、リファレンスガバナ（ＲＧ）、及び、フィードバックコントローラを備える。

　目標値マップは、制御対象プラントの運転条件を示す外生入力ｄが与えられると、制御出力であるＤＰＦ温度の目標値ｒを出力する。外生入力ｄには、排気ガスの質量流量や大気温度等が含まれる。外生入力ｄに含まれるこれらの物理量は計測値でもよいし推定値でもよい。

　リファレンスガバナは、ＤＰＦ温度の目標値ｒが与えられると、ＤＰＦ温度に課せられた制約が満たされるように目標値ｒを修正し、ＤＰＦ温度の修正目標値ｗを出力する。図２中に示すｚは制御入力や制御出力を状態量のうち制約のある特定状態量を表現している。ここでは、制約のある特定状態量ｚは制御出力であるＤＰＦ温度を意味するものとする。ＤＰＦ温度には制約として上限値が設けられている。ＤＰＦ温度が上昇し続けるとＤＰＦの溶損に至るおそれがある。制約として設定された上限値は、溶損を防いでＤＰＦの信頼性を担保することのできる値とされている。

　フィードバックコントローラは、リファレンスガバナからＤＰＦ温度の修正目標値ｗが与えられると、ＤＰＦ温度の現在値を示す状態量ｘを取得し、修正目標値ｗと状態量ｘとの偏差ｅに基づくフィードバック制御によって制御対象プラントに与える制御入力ｕを決定する。本実施の形態に係る制御対象プラントは後処理システムであるので、制御入力ｕには、燃料添加弁によって排気ガス中に添加される燃料量、すなわち、燃料添加量が用いられる。フィードバックコントローラの仕様に限定はなく、公知のフィードバックコントローラを用いることができる。例えば、比例積分フィードバックコントローラを用いることが可能である。

　図３は図２に示す目標値追従制御構造を等価変形して得られたフィードフォワード構造を示す図である。図２において破線で囲まれた閉ループ系は既に設計済みであるとして、図３に示すフィードフォワード構造では１つのモデルとされている。閉ループ系のモデルは次のモデル式（１）で表される。式（１）において、ｆ，ｇはモデル式の関数である。また、ｋは閉ループ系のサンプル時間に対応した離散時刻を表している。

　リファレンスガバナは、プログラムされたアルゴリズムに従って動作する。このアルゴリズムによれば、リファレンスガバナは、与えられた目標値ｒに基づいて修正目標値ｗの候補を決定する。そして、外生入力ｄと修正目標値候補のそれぞれを上記の式（１）で表される予測モデルに入力してＤＰＦ温度の将来の予測値を計算する。リファレンスガバナは予め定められた予測ホライズンにわたってＤＰＦ温度の予測値を計算し、ＤＰＦ温度の予測値が制約に抵触するかどうか、つまり、予測値がＤＰＦ温度の上限値を超えていないかどうか修正目標値候補ごとに判定する。そして、予測値が制約に抵触しない範囲で本来の目標値ｒに最も近い修正目標値候補を最終的な修正目標値ｗとして決定する。

　リファレンスガバナアルゴリズムは、詳しくは、図４のフローチャートと付随する図５－図９の説明図とによって説明することができる。以下、図４のフローチャートに沿ってリファレンスガバナアルゴリズムの詳細を説明する。

　図４のフローチャートに示すリファレンスガバナアルゴリズムは、閉ループ系のサンプル時間ごとに繰り返し実行される。ステップＳ１では、ＤＰＦ温度の修正目標値候補が初期化される。修正目標値候補の初期値Trg_iniには、前回の離散時刻k-1において出力された修正目標値Trg_fin(k-1)が用いられる。また、ステップＳ１では、修正目標値候補の探索を反復して行った回数（反復回数）jが初期値の１に初期化される。なお、以下では今回の修正目標値候補、すなわち、反復回数jにおける修正目標値候補をTrg_mod(j)と表記する。

　ステップＳ２では、予測モデルを用いたＤＰＦ温度の予測回数iが初期値の１に初期化される。なお、予測回数iはリファレンスガバナの予測周期に対応した離散時刻を意味し、i=1に対応する離散時刻からi=Pendに対応する離散時刻までの期間が予測ホライズンである。Pendは目標予測回数であって、予測ホライズンの最終の離散時刻に対応する。

　ステップＳ３では、予測モデル演算処理、すなわち、予測モデルを用いたＤＰＦ温度の予測値の計算が行われる。予測モデル演算処理によれば、ＤＰＦ温度の今回の修正目標値候補Trg_mod(j)に基づき、予測モデルを用いて予測回数iにおけるＤＰＦ温度の予測値T(j,i)が計算される。なお、予測モデルの離散時刻の間隔、つまり、予測周期は任意に設定することができる。図５は、予測モデル演算処理のイメージを示す図であって、予測周期が２秒に設定されている場合にＤＰＦ温度予測値の演算が３回まで実行された例が描かれている。なお、図５においてＤＰＦ温度予測値の折線と併せて描かれている直線は、ＤＰＦ温度の本来の目標値（最終目標値）Treqを示す直線である。

　ステップＳ４では、ＤＰＦの信頼性要件についての判定が行われる。信頼性要件とは、ＤＰＦ温度が制約である上限値以上になっていないことである。ステップＳ３で計算されたＤＰＦ温度予測値T(j,i)と上限値Tlimitとが比較され、ＤＰＦ温度予測値T(j,i)が上限値Tlimitよりも小さければ、制約に抵触していない、つまり、信頼性要件が満たされていると判定される。

　信頼性要件が満たされている場合、処理はステップＳ５に進む。ステップＳ５では、予測回数iが目標予測回数Pendに達したかどうか判定される。

　予測回数iが目標予測回数Pend未満の場合、処理はステップＳ６に進む。ステップＳ６では、予測回数iがインクリメントされる。そして、処理は再びステップＳ３に進み、予測モデルを用いて今回の予測回数iにおけるＤＰＦ温度の予測値T(j,i)が計算される。そして、予測回数iが目標予測回数Pendに達するまで、ステップＳ３－Ｓ６の処理が繰り返し実行される。

　予測回数iが目標予測回数Pendに達した場合、処理はステップＳ７に進む。ステップＳ７では、評価関数演算、すなわち、予め定義された評価関数を用いて今回の修正目標値候補Trg_mod(j)の評価値Ｊ(j)を計算することが行われる。評価値Ｊ(j)はゼロが最も望ましい値であり、評価値Ｊ(j)が大きいほど修正目標値候補Trg_mod(j)の評価は低くなる。評価値Ｊ(j)を与える評価関数は、具体的には以下の式（２）で表される。式（２）におけるmap[Treq-T(j,i)]は、最終目標値TreqとＤＰＦ温度予測値T(j,i)との偏差を引数とするマップから決められるマップ値である。

　図６は、評価値Ｊ(j)の計算に使用されるマップの設定を示している。ＤＰＦ温度予測値T(j,i)は最終目標値Treqに近いほど望ましく、また、最終目標値Treqを超えないほうが望ましい。このため、図６に示すマップでは、ＤＰＦ温度予測値T(j,i)が最終目標値Treqに一致するときにマップ値はゼロとなり、ＤＰＦ温度予測値T(j,i)が最終目標値Treqから離れるにつれてマップ値が大きくなるように設定されている。また、このマップでは、ＤＰＦ温度予測値T(j,i)が最終目標値Treqより大きい場合のほうが、小さい場合よりも、ＤＰＦ温度予測値T(j,i)と最終目標値Treqとの距離の増分に対するマップ値の増分が大きくなるように設定されている。

　ステップＳ８－Ｓ１０では、離散時刻kにおいて出力すべき修正目標値Trg_fin(k)の更新が行われる。まず、ステップＳ８では、以下の式（３）に示すように、今回計算された修正目標値候補Trg_mod(j)の評価値J(j)と、反復回数j-1における修正目標値候補Trg_mod(j-1)の評価値J(j-1)との偏差J_dltが計算される。そして、偏差J_dltがゼロ以下かどうか判定される。

　図７は、評価値演算処理のイメージを示す図であって、反復回数による評価値の変化の例が描かれている。図７におけるcase1のように前回の評価値J(j-1)よりも今回の評価値J(j)のほうが大きい場合、偏差J_dltはゼロより大きくなる。偏差J_dltがゼロより大きいことは、今回の修正目標値候補Trg_mod(j)よりも前回の修正目標値候補Trg_mod(j-1)の方が評価が高いことを意味する。一方、case2のように前回の評価値J(j-1)よりも今回の評価値J(j)のほうが小さい場合、偏差J_dltはゼロよりも小さくなる。偏差J_dltがゼロ以下であることは、今回の修正目標値候補Trg_mod(j)の方が前回の修正目標値候補Trg_mod(j-1)よりも評価が高いことを意味する。

　偏差J_dltがゼロ以下の場合、処理はステップＳ９に進む。ステップＳ９では今回設定された修正目標値候補Trg_mod(j)が最終的な修正目標値Trg_fin(k)として仮決定される。より評価が高い修正目標値候補へと修正目標値Trg_fin(k)の値を更新していくことにより、修正目標値Trg_fin(k)は最終目標値Treqへと近づけられていく。

　偏差J_dltがゼロより大きい場合、処理はステップＳ１０に進む。ステップＳ１０では、出力すべき修正目標値Trg_fin(k)の値は前回の仮決定値のまま保持される。つまり、現在までにおいて最終目標値Treqに最も近い修正目標値候補がそのまま最終的な修正目標値Trg_fin(k)として保持される。

　また、ステップＳ４において信頼性要件が満たされていないと判定された場合、処理はステップＳ５－Ｓ８をスキップしてステップＳ１０に直接進む。つまり、ＤＰＦ温度予測値T(j,i)が上限値Tlimitに達したら、今回の修正目標値候補Trg_mod(j)に基づく予測モデル演算は直ちに打ち切られる。この場合、残りの離散時刻、つまり、予測回数i+1から目標予測回数Pendまでの離散時刻におけるＤＰＦ温度予測値の計算はキャンセルされる。そして、今回の修正目標値候補Trg_mod(j)は最終的な修正目標値Trg_fin(k)の対象から除外され、ステップＳ１０では、修正目標値Trg_fin(k)の値は前回の仮決定値のまま保持される。ＤＰＦ温度を制約に抵触させるような修正目標値候補は、最終的な修正目標値としては相応しくない。よって、当該修正目標値候補に係る予測モデル演算を途中で打ち切ったとしても不都合はなく、むしろ、それにより制御装置の演算負荷を低減することができる。

　ステップＳ９或いはステップＳ１０の後、処理はステップＳ１１に進む。ステップＳ１１では、反復回数jが予め設定された予定反復回数Lendに達したかどうか判定される。

　反復回数jが予定反復回数Lend未満の場合、処理はステップＳ１２に進む。ステップＳ１２では、次回の反復回数j+1における修正目標値候補Trg_mod(j+1)が決定される。つまり、予測モデル演算で使用する修正目標値候補の更新が行われる。本アルゴリズムによれば、基本的には、前回の修正目標値候補Trg_mod(j-1)の評価値J(j-1)に対する今回の修正目標値候補Trg_mod(j)の評価値J(j)の変化の方向と、前回の修正目標値候補Trg_mod(j-1)に対する今回の修正目標値候補Trg_mod(j)の変化の方向との組み合わせによって次回の修正目標値候補Trg_mod(j+1)が決定される。

　図８は、修正目標値候補の更新規則を具体的に示した表である。図８の表におけるTrg_dltは、以下の式（４）に示すように、今回の修正目標値候補Trg_mod(j)と前回の修正目標値候補Trg_mod(j-1)との偏差として算出される。修正目標値候補Trg_mod(j)が前回よりも増側に更新されていれば、偏差Trg_dltはゼロより大きくなり、修正目標値候補Trg_mod(j)が前回よりも減側に更新されていれば、偏差Trg_dltはゼロより小さくなる。

　図８の表によれば、偏差Trg_dltが正の値で偏差J_dltが負の値の場合、つまり、修正目標値候補Trg_mod(j)を前回よりも増側に補正したことにより評価値が前回よりも好転した場合には、次回の修正目標値候補Trg_mod(j+1)は今回値よりもさらに増側に補正される。つまり、今回の修正目標値候補Trg_mod(j)に正値の修正量mod(j+1)を加算した値が、次回の修正目標値候補Trg_mod(j+1)として設定される。次回の修正量mod(j+1)の大きさは、今回の修正量mod(j)と同じ大きさに設定される。なお、修正量の初期値は、最終目標値Treqと修正目標値候補の初期値Trg_iniとの偏差に１以下の所定の係数を乗じた値とされている。

　一方、偏差Trg_dltが正の値で偏差J_dltが正の値の場合、つまり、修正目標値候補Trg_mod(j)を前回よりも増側に補正したことにより評価値が前回よりも悪化した場合には、次回の修正目標値候補Trg_mod(j+1)は今回値よりも減側に補正される。つまり、今回の修正目標値候補Trg_mod(j)に負値の修正量mod(j+1)を加算した値が、次回の修正目標値候補Trg_mod(j+1)として設定される。次回の修正量mod(j+1)の大きさは、今回の修正量mod(j-1)の大きさに１未満の所定の係数を乗じた大きさとされる。つまり、補正の方向が同方向である場合には修正量mod(j+1)の大きさは維持されるが、補正の方向を逆方向に修正する場合には、修正量mod(j+1)の大きさは小さくされる。

　偏差Trg_dltが負の値で偏差J_dltが負の値の場合、つまり、修正目標値候補Trg_mod(j)を前回よりも減側に補正したことにより評価値が前回よりも好転した場合には、次回の修正目標値候補Trg_mod(j+1)は今回値よりもさらに減側に補正される。つまり、今回の修正目標値候補Trg_mod(j)に負値の修正量mod(j+1)を加算した値が、次回の修正目標値候補Trg_mod(j+1)として設定される。次回の修正量mod(j+1)の大きさは、今回の修正量mod(j)と同じ大きさに設定される。

　偏差Trg_dltが負の値で偏差J_dltが正の値の場合、つまり、修正目標値候補Trg_mod(j)を前回よりも減側に補正したことにより評価値が前回よりも悪化した場合には、次回の修正目標値候補Trg_mod(j+1)は今回値よりも増側に補正される。つまり、今回の修正目標値候補Trg_mod(j)に正値の修正量mod(j+1)を加算した値が、次回の修正目標値候補Trg_mod(j+1)として設定される。次回の修正量mod(j+1)の大きさは、今回の修正量mod(j)の大きさに１未満の所定の係数を乗じた大きさとされる。

　上記更新規則の例外は、ある予測回数iにおけるＤＰＦ温度予測値T(j,i)が上限値Tlimitに達したためにステップＳ４から直接ステップＳ１０に進んだケースである。このケースでは、次回の修正目標値候補Trg_mod(j+1)は今回値よりも減側に補正される。つまり、次回の修正量mod(j+1)は負値であり、その大きさは今回の修正量mod(j)の大きさに１未満の所定の係数を乗じた大きさとされる。また、このケースでは、次回の更新処理における演算の整合性のため、今回の修正目標値候補Trg_mod(j)の評価値J(j)が最大値Jmaxに定められる。

　ステップＳ１２では、上記のように修正目標値候補の更新が行われた後、反復回数jがインクリメントされる。そして、処理は再びステップＳ２に進み、予測モデルを用いたＤＰＦ温度の予測回数iが初期値の１に初期化される。そして、反復回数jが予定反復回数Lendに達するまで、ステップＳ２－Ｓ１２の処理が繰り返し実行される。

　反復回数jが予定反復回数Lendに達した場合、処理はステップＳ１３に進む。ステップＳ１３では、仮決定されていた修正目標値Trg_fin(k)が最終的な修正目標値として正式決定され、フィードバックコントローラに出力される。これにより、今回の離散時刻kにおける修正目標値決定処理が完了する。今回出力された修正目標値Trg_fin(k)は次回の離散時刻k+1において修正目標値候補の初期値Trg_iniとして用いられる。

　図９は、上述のアルゴリズムによって達成されるリファレンスガバナの動作のイメージを示す図である。図９の上段は修正目標値候補Trg_modの反復回数による変化を示し、中段は修正量modの反復回数による変化を示し、下段は評価値Jの反復回数による変化を示している。反復回数１で設定される修正目標値候補Trg_mod(1)は初期値であり、前回出力された修正目標値Trg_finの値とされる。反復回数２で設定される修正量mod(2)は初期値であり、最終目標値Treqと修正目標値候補Trg_mod(1)との偏差に１以下の所定の係数を乗じた値とされる。

　図９に示す例では、反復回数２のとき、修正目標値候補Trg_mod(1)に正値の修正量mod(2)が加えられることで、修正目標値候補Trg_mod(2)は増側に補正される。その結果、評価値J(2)が前回値よりも減少した場合、反復回数３の修正量mod(3)は修正量mod(2)と同値とされ、修正目標値候補Trg_mod(3)はさらに増側に補正される。

図９に示す例では、反復回数３のときの予測モデル演算において、予測回数２のときにＤＰＦ温度予測値T(3,2)が上限値Tlimitを超えている。このため、無駄な予測モデル演算は打ち切って制御装置の演算負荷を低減すべく、修正目標値候補Trg_mod(3)に関する予測回数３以降の予測モデル演算はキャンセルされ、評価値J(3)は最大値Jmaxに設定される。この場合、反復回数４の修正量mod(4)は負値に変更されるとともに、その大きさは修正量mod(3)の大きさよりも小さくされる。

　修正量mod(4)が負値とされることで、反復回数４における修正目標値候補Trg_mod(4)は減側に補正される。その結果、評価値J(4)が前回値よりも減少した場合、反復回数５の修正量mod(5)は修正量mod(4)と同値とされ、修正目標値候補Trg_mod(5)はさらに減側に補正される。その補正によって評価値J(5)が前回値よりも増大した場合、反復回数６の修正量mod(6)は正値に変更されるとともに、その大きさは修正量mod(5)の大きさよりも小さくされる。これにより、反復回数６における修正目標値候補Trg_mod(6)は僅かに増側に補正される。このように、修正目標値候補Trg_modの補正の方向が増側から減側へ、或いは減側から増側へ変更されるごとに補正量modの大きさは小さくされる。これにより、修正目標値候補Trg_modはある一定の値に収束していくことになる。

　以上、本発明の実施の形態の１つについて説明した。ただし、本発明は上述の実施の形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。例えば、以下のような変形例を採ることができる。

　予測モデルには予測誤差が含まれるため、予測モデルで予測されるＤＰＦ温度よりも真のＤＰＦ温度のほうが高いことはあり得る。よって、予測誤差によってＤＰＦ温度が上限値を超えてしまうことのないよう、ＤＰＦ温度予測値の上限値に予測誤差に対する余裕度を加えても良い。つまり、予測誤差の分だけ制約を厳しくするように、予測誤差に応じて上限値を低く設定しても良い。なお、予測誤差は予測モデル演算のループ回数が進むほど拡大することが分かっている。よって、予測回数に応じてＤＰＦ温度の上限値を低く設定することは、制約への抵触を防止する上で好ましい方法である。

　上述のアルゴリズムによれば、反復回数が予定反復回数に達したら修正目標値候補の更新は終了される。しかし、その途中、制約への抵触により予測モデル演算が途中でキャンセルされている場合には、計算のキャンセルに伴う演算負荷の減少分に応じて修正目標値候補の更新回数を増やしてもよい。修正目標値候補の更新回数を増やすことで、より良い修正目標値を探索することが可能になり、ＤＰＦ温度の制御精度を向上させることができる。

　上述のアルゴリズムによれば、修正目標値候補は更新規則に従って順次更新される。しかし、一度に複数の修正目標値候補を設定することもできる。例えば、本来の目標値を基準にして一定の温度間隔で複数の修正目標値候補を設定してもよい。この場合、それら複数の修正目標値候補のそれぞれに基づいて予測モデル演算処理と評価値演算処理とを実行し、評価値間の比較に基づいてそれら複数の修正目標値候補の中から最終的な修正目標値を選定すればよい。

　上述のアルゴリズムではＤＰＦ温度のみに制約が課せられているが、ＤＯＣ温度や燃料添加量或いはその他の状態量にも制約が課せられていてもよい。この場合、ステップＳ３では、制御対象プラントの状態量のうち制約が課せられている特定状態量の全てに関して予測ホライズンにわたる予測を実行すればよい。そして、ステップＳ４では、制約が課せられている特定状態量の少なくとも１つが制約に抵触したら、予測モデル演算を停止して残りの計算をキャンセルすればよい。

　上述のアルゴリズムで用いられている評価関数はあくまでも一例である。好ましくは、予測モデル演算処理で計算された各離散時刻におけるＤＰＦ温度の予測値と本来の目標値との距離が小さいほど望ましい評価値を与える評価関数であればよい。上述のアルゴリズムによれば、制約への抵触の判定はステップＳ３で別途行われるので、例えばペナルティ法のような制約を考慮した評価関数の設計は行わなくてよい。また、上述のアルゴリズムによれば、制約への抵触が起こり得る修正目標値候補は最終的な修正目標値の対象から確実に除外されるので、ペナルティ法などに比較して制約への抵触をより確実に防止することができる。

　上述の実施の形態では、本発明に係るプラント制御装置をディーゼルエンジンの後処理システムに適用した。しかし、本発明に係るプラント制御装置は、制御対象プラントをディーゼルエンジン本体とすることができる。制御対象プラントがディーゼルエンジン本体である場合、制御入力を可変ノズル開度とし、制御出力を過給圧とすることができる。つまり、本発明はディーゼルエンジンの過給圧制御に適用することができる。また、制御入力をＥＧＲ弁開度とし、制御出力をＥＧＲ率とすることができる。つまり、本発明はディーゼルエンジンのＥＧＲ制御に適用することもできる。さらに、制御入力を可変ノズル開度とＥＧＲ弁開度とディーゼルスロットル開度とし、制御出力を過給圧とＥＧＲ率とすることができる。つまり、本発明はディーゼルエンジンにおける過給圧とＥＧＲ率の協調制御に適用することもできる。

　さらに、本発明に係るプラント制御装置が適用されるプラントはディーゼルエンジンのみに限定されない。例えば、ガソリンエンジンやハイブリッドシステム等の他の車載動力プラントの他、燃料電池システムにも適用することができる。さらに、リファレンスガバナとフィードバックコントローラを用いて制御を行うことができるプラントであれば、定置型プラントも含めて広い範囲のプラントに適用することができる。

Claims

　プラントの制御出力を目標値に近づけるようにフィードバック制御によって前記プラントの制御入力を決定するフィードバックコントローラと、
　前記フィードバックコントローラに与えられる目標値を修正するリファレンスガバナとを備え、
　前記リファレンスガバナは、
　前記制御出力の修正目標値候補に基づき、前記プラントと前記フィードバックコントローラとを含む閉ループ系がモデル化された予測モデルを用いて、制約が課せられた特定状態量を含む前記プラントの状態量の予測値を有限の予測ホライズンにわたって順次計算する予測モデル演算処理と、
　前記予測モデル演算処理で得られた計算結果に基づき、予め定義された評価関数を用いて、前記修正目標値候補の評価値を計算する評価関数演算処理と、
　前記予測モデル演算処理と前記評価関数演算処理とを複数の修正目標値候補に関して実行し、前記複数の修正目標値候補のそれぞれの評価値に基づいて最終的な修正目標値を決定する修正目標値決定処理と、を実行するように構成され、
　前記リファレンスガバナは、ある修正目標値候補に関する予測モデル演算処理により予測された前記特定状態量の予測値が制約に抵触した場合には、当該修正目標値候補を最終的な修正目標値の対象から除外することを特徴とするプラント制御装置。
　前記リファレンスガバナは、ある修正目標値候補に関する予測モデル演算処理の途中で前記特定状態量の予測値が制約に抵触した場合には、当該修正目標値候補に関する予測モデル演算処理の残りの計算をキャンセルすることを特徴とする請求項１に記載のプラント制御装置。
　前記リファレンスガバナは、前記予測モデル演算処理では、予め設定された予測周期で離散的に前記状態量の予測値を計算し、
　前記リファレンスガバナは、ある修正目標値候補に関する予測モデル演算処理において最初の離散時刻から最終の離散時刻までの間の途中の離散時刻で前記特定状態量の予測値が制約に抵触した場合には、残りの離散時刻における前記状態量の予測値の計算をキャンセルすることを特徴とする請求項２に記載のプラント制御装置。
　前記リファレンスガバナは、前記予測モデル演算処理に係る離散時刻が進むにつれて、前記特定状態量の予測値が制約に抵触したかどうか判定するための閾値をより厳しい値に変更することを特徴とする請求項３に記載のプラント制御装置。
　前記リファレンスガバナは、前記評価関数演算処理では、前記予測モデル演算処理で計算された各離散時刻における前記制御出力の予測値と前記制御出力の本来の目標値との距離が小さいほど望ましい評価値を与える評価関数を使用し、
　前記リファレンスガバナは、前記修正目標値決定処理では、前記評価値が最も望ましい値となる修正目標値候補を最終的な修正目標値として決定することを特徴とする請求項３又は４に記載のプラント制御装置。
　前記リファレンスガバナは、前記修正目標値決定処理では、予め定義された更新規則に従って前記修正目標値候補を更新し、
　前記更新規則によれば、前回の修正目標値候補の評価値に対する今回の修正目標値候補の評価値の変化の方向と、前回の修正目標値候補に対する今回の修正目標値候補の変化の方向との組み合わせによって次回の修正目標値候補が決定されることを特徴とする請求項１乃至５の何れか１項に記載のプラント制御装置。
　前記リファレンスガバナは、前記修正目標値決定処理では、前回の修正目標値候補の評価値に対して今回の修正目標値候補の評価値がより望ましい値であれば、今回の修正目標値候補を最終的な修正目標値として仮決定し、前回の修正目標値候補の評価値に対して今回の修正目標値候補の評価値がより望ましい値でなければ、前回仮決定した最終的な修正目標値をそのまま保持することを特徴とする請求項６に記載のプラント制御装置。
　前記リファレンスガバナは、制約への抵触により前記予測モデル演算処理の途中で残りの計算のキャンセルした場合、前記修正目標値決定処理では、計算のキャンセルに伴う演算負荷の減少分に応じて前記修正目標値候補の更新回数を増やすことを特徴とする請求項６又は７に記載のプラント制御装置。