JP7154774B2 - Optimal control device, control method and computer program - Google Patents
Optimal control device, control method and computer program Download PDFInfo
- Publication number
- JP7154774B2 JP7154774B2 JP2018033243A JP2018033243A JP7154774B2 JP 7154774 B2 JP7154774 B2 JP 7154774B2 JP 2018033243 A JP2018033243 A JP 2018033243A JP 2018033243 A JP2018033243 A JP 2018033243A JP 7154774 B2 JP7154774 B2 JP 7154774B2
- Authority
- JP
- Japan
- Prior art keywords
- gradient
- evaluation
- manipulated variable
- control
- extreme value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C02—TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
- C02F—TREATMENT OF WATER, WASTE WATER, SEWAGE, OR SLUDGE
- C02F3/00—Biological treatment of water, waste water, or sewage
- C02F3/34—Biological treatment of water, waste water, or sewage characterised by the microorganisms used
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
Description
本発明の実施形態は、最適制御装置、制御方法及びコンピュータプログラムに関する。 Embodiments of the present invention relate to an optimum control device, control method, and computer program.
近年、プラント制御の方法として、極値制御と呼ばれる技術が注目されている。極値制御は、プラントの複雑なモデルを用いないモデルフリーのリアルタイム最適制御技術である。極値制御の概要は、操作量を強制的に変化させることにより、制御対象プロセスの制御量に基づく評価量が最適化される操作量を探索していくものである。このような極値制御をプラント制御に適用する場合、極値制御に係る各種のパラメータ(以下「制御パラメータ」という。)を制御対象プロセスの特性に応じて適切に設定する必要がある。従来、制御パラメータの設計に関する指針がいくつか示されているが、そのいずれも制御対象プロセスの時間的な変化(以下「ダイナミクス」という。)に適応して極値制御を安定的に動作させることができるまでには至っていない。 In recent years, a technique called extremum control has attracted attention as a method of plant control. Extremum control is a model-free real-time optimal control technique that does not use a complex model of the plant. The outline of extreme value control is to forcibly change the manipulated variable to search for the manipulated variable that optimizes the evaluation amount based on the controlled variable of the controlled process. When such extreme value control is applied to plant control, it is necessary to appropriately set various parameters (hereinafter referred to as "control parameters") related to extreme value control according to the characteristics of the process to be controlled. Conventionally, some guidelines for designing control parameters have been presented, but all of them are designed to adapt to temporal changes in the controlled process (hereinafter referred to as "dynamics") and to stably operate extremum control. It has not reached the point where it can be done.
本発明が解決しようとする課題は、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる最適制御装置、制御方法及びコンピュータプログラムを提供することである。 The problem to be solved by the present invention is to provide an optimum control device, a control method, and a computer program that can adapt to the dynamics of a process to be controlled and operate extremum control more stably.
実施形態の最適制御装置は、制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置である。最適制御装置は、勾配推定部と、補正部と、を持つ。勾配推定部は、前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する。補正部は、前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する。 The optimum control device according to the embodiment is configured such that the evaluation amount is determined based on the operation amount of the controlled process and the evaluation amount indicating the index related to the optimization of the controlled process based on the control amount that changes according to the operation amount. The control device executes extreme value control for changing the manipulated variable so as to move toward the optimum value. The optimum controller has a gradient estimator and a corrector. The gradient estimating unit estimates a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and unknown with respect to the manipulated variable, based on the evaluation quantity observed for the controlled process. do. The correction unit adapts the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control to changes in the evaluation function, based on the estimated value of the gradient obtained by the gradient estimator. to correct.
以下、実施形態の最適制御装置、制御方法及びコンピュータプログラムを、図面を参照して説明する。 BEST MODE FOR CARRYING OUT THE INVENTION An optimum control device, a control method, and a computer program according to embodiments will be described below with reference to the drawings.
(概略)
図1は、極値制御の基本的な概念を説明する図である。極値制御は、評価量の変化に基づいて操作量を更新していくことで評価量を最適値に近づけていく制御手法である。評価量は、制御対象となるプロセス(以下「制御対象プロセス」という。)についての最適化の指標となる値である。評価量は、制御対象プロセスの制御量に基づいて決定される指標値であり、評価量と制御量との関係は所定の評価関数によって表される。この評価関数は、制御量に基づくものであれば任意の評価基準に基づいて設定されてよい。また評価量は制御量そのものであってもよい。一般に、極値制御において、制御対象プロセスの評価関数は操作量に対して未知の関数である。
(outline)
FIG. 1 is a diagram for explaining the basic concept of extreme value control. Extreme value control is a control method that brings the evaluation amount closer to the optimum value by updating the manipulated variable based on the change in the evaluation amount. The evaluation amount is a value that serves as an optimization index for a process to be controlled (hereinafter referred to as "controlled process"). The evaluation amount is an index value determined based on the control amount of the process to be controlled, and the relationship between the evaluation amount and the control amount is represented by a predetermined evaluation function. This evaluation function may be set based on any evaluation criteria as long as it is based on the control amount. Also, the evaluation amount may be the control amount itself. Generally, in extreme value control, the evaluation function of the controlled process is an unknown function with respect to the manipulated variable.
極値制御ではディザー信号と呼ばれる周期的な信号によって操作量を変化させる。通常このディザー信号は、正弦波で与えられることが多い。極値制御では、まずディザー信号によって操作量を継続的に振動させ、それによって生じる評価量の変化(増減)を観測する。そして、観測された評価量の変化に基づいて、評価量を評価関数の最適値(最大値又は最小値)に近づけるような操作量を算出し、算出された操作量で現在の操作量を更新する。極値制御は、このような評価量の観測及び操作量の更新を繰り返すことによって評価関数の最適値を探索していく制御方法である。 In extreme value control, the manipulated variable is changed by a periodic signal called a dither signal. Usually, this dither signal is often given as a sine wave. In extreme value control, first, the operation amount is continuously oscillated by a dither signal, and the resulting change (increase or decrease) in the evaluation amount is observed. Then, based on the observed change in the evaluation amount, calculate the operation amount that brings the evaluation amount closer to the optimum value (maximum value or minimum value) of the evaluation function, and update the current operation amount with the calculated operation amount. do. The extreme value control is a control method that searches for the optimum value of the evaluation function by repeating such observation of the evaluation amount and updating of the manipulated variable.
図1(A)の評価関数曲線EVは、操作量に対して未知の評価関数を表す。ここでは、説明の便宜のため、未知の評価関数を下に凸の二次関数として想定する。図1(B)は、このような評価関数を持つ制御対象プロセスに対してディザー信号で操作量を変化させたときに、ディザー信号の位相と逆位相の評価量が得られた場合を示す。この場合、操作量の増加に対して評価量が減少しているため、動作点が評価関数曲線EVの極小点Pminより左側で変化したことが分かる。一方、図1(C)は、図1(B)と同様のディザー信号に対して、ディザー信号の位相と同位相の評価量が得られた場合を示す。この場合、操作量の増加に対して評価量も増加しているため、動作点が極小点Pminより右側で変化したことが分かる。 An evaluation function curve EV in FIG. 1A represents an unknown evaluation function with respect to the manipulated variable. Here, for convenience of explanation, the unknown evaluation function is assumed to be a downwardly convex quadratic function. FIG. 1(B) shows a case where an evaluation amount opposite in phase to the phase of the dither signal is obtained when the manipulated variable is changed with the dither signal for the process to be controlled having such an evaluation function. In this case, since the evaluation amount decreases as the operation amount increases, it can be seen that the operating point has changed to the left of the minimum point Pmin of the evaluation function curve EV. On the other hand, FIG. 1(C) shows a case where an evaluation amount having the same phase as the dither signal is obtained for a dither signal similar to that of FIG. 1(B). In this case, since the evaluation amount also increases with an increase in the manipulated variable, it can be seen that the operating point has changed to the right of the minimum point Pmin.
したがって、操作量を周期的に増減させた結果、評価量の増減が操作量の増減と同位相の動きをする場合には操作量を減少させ、逆位相の動きをする場合には操作量を増加させることによって、評価量を最適値に近づけることができる。従来、産業用プラントの制御方式として一般的に用いられてきたPID制御(Proportional-Integral-Derivative Control)は、制御量が予め設定された目標値に追従するように操作量を制御する目標値追従型の制御方式であった。これに対して、極値制御は、評価量が最適化されるような操作量を探索する最適値探索型の制御方式であるため、PID制御のように操作量と制御量との関係を表すプロセスモデルを予め必要としない。そのため、極値制御は、目標値を予め設定できないような制御対象プロセスについても有効な制御方式であり、今後広く普及する可能性を秘めている。このような原理で極値制御を行う極値制御コントローラは比較的簡単な構成で実現することができる。 Therefore, as a result of periodically increasing/decreasing the manipulated variable, if the increase/decrease in the evaluation amount moves in the same phase as the increase/decrease in the manipulated variable, the manipulated variable is decreased. By increasing the evaluation amount, the evaluation amount can be brought closer to the optimum value. Conventionally, PID control (Proportional-Integral-Derivative Control), which has been generally used as a control method for industrial plants, is a target value tracking system that controls the manipulated variable so that the controlled variable follows a preset target value. It was a mold control method. On the other hand, since extreme value control is an optimum value search type control method that searches for an operation amount that optimizes the evaluation amount, it expresses the relationship between the operation amount and the control amount like PID control. No process model is required in advance. Therefore, extreme value control is an effective control method even for a controlled process for which a target value cannot be set in advance, and has the potential to become widely used in the future. An extreme value control controller that performs extreme value control based on such a principle can be realized with a relatively simple configuration.
図2は、極値制御を実現する極値制御システム9の基本的な構成例を示すブロック線図である。図2の極値制御システム9(極値制御部)は、ハイパスフィルタ11(HPF:High-Pass Filter)、ディザー信号出力部12、ローパスフィルタ13(LPF:Low-Pass Filter)及び推定器14を備える。このように極値制御システム9の構成は、従来のPID制御コントローラと比較しても同程度の複雑さである。そのため、極値制御システム9は、PID制御コントローラと同様に、PLC(Programmable Logic Controller)等のハードウェアを用いて容易に実装可能である。以下、図2の極値制御システム9の動作の概要について説明する。なお、ここでは、最適値として評価関数の極小値を探索する場合を例に説明する。
FIG. 2 is a block diagram showing a basic configuration example of an extreme
極値制御システム9は、周期的な変化を持つディザー信号M(MはModulationを意味する)を作用させることによって、制御対象プロセスTPの操作量を強制的に変化させる。以下、この操作をモジュレーション(Modulation:変調)と呼ぶ。このモジュレーションにより、制御対象プロセスTPの操作量が周期的に変化し、操作量の変化に応じて制御量が変化する。制御対象プロセスTPは、制御量に基づいて評価量を取得し、取得した評価量を極値制御システム9にフィードバックする。
The
なお、制御量に基づいて評価量を取得する機能(以下「評価量取得機能」という。)は、必ずしも制御対象プロセスTPに含まれる必要はない。例えば、評価量取得機能は極値制御システム9に含まれてもよいし、制御対象プロセスTPと極値制御システム9との間に評価量取得機能を有する他の装置が介在してもよい。
It should be noted that the function of acquiring the evaluation amount based on the control amount (hereinafter referred to as the "evaluation amount acquisition function") does not necessarily have to be included in the controlled process TP. For example, the evaluation value acquisition function may be included in the extreme
通常、操作量の変化に対する評価量の変化はある程度の時間遅れを伴って現れる。上述したように、極値制御は操作量に対して未知の評価関数の極値を探索する制御方法である。そのため、制御対象プロセスTPの評価関数は極小値を持つことが前提であるが、その値は操作量に対して未知である。 Normally, the change in the evaluation amount with respect to the change in the manipulated variable appears with some time delay. As described above, extreme value control is a control method for searching for extreme values of unknown evaluation functions with respect to manipulated variables. Therefore, it is assumed that the evaluation function of the controlled process TP has a minimum value, but the value is unknown with respect to the manipulated variable.
ハイパスフィルタ11は、フィードバックされた評価量から未知の極小値に応じた一定値のバイアスを除去する。この処理はすなわち、未知の極小値を常にゼロに調整するための処理であり、推定器14が操作量に対して与える変化の方向(増加又は減少)を決定するために必要な前処理である。
A high-
ディザー信号出力部12は、このように調整された評価量に対してディザー信号D(DはDemodulationを意味する)を作用させる。これにより、操作量のモジュレーションに応じて変化した評価量からディザー信号Mと同じ周波数成分が抽出される。以下、この操作をデモジュレーション(Demodulation:復調)と呼ぶ。デモジュレーションの役割は次のとおりである。
The dither
上述したとおり制御対象プロセスTPの操作量に対する評価関数は未知である。そのため、評価関数には非線形要素が含まれている場合がある。この場合、評価関数は下に凸(極大値探索の場合は上に凸)の非線形関数であると想定される。このような非線形要素に起因して、評価量にはディザー信号Mの周波数ωに応じた高調波成分や分調波成分が現れる可能性が高い。デモジュレーションは、このような高調波や分調波の影響を取り除くための処理である。このデモジュレーションによって、評価量に含まれる成分のうち、評価量を変化させたディザー信号Mと同じ周波数ωの成分が抽出される。 As described above, the evaluation function for the manipulated variable of the controlled process TP is unknown. Therefore, the evaluation function may contain nonlinear elements. In this case, the evaluation function is assumed to be a downwardly convex (or upwardly convex in case of local maximum search) nonlinear function. Due to such non-linear elements, there is a high possibility that harmonic components and subharmonic components corresponding to the frequency ω of the dither signal M appear in the evaluation quantity. Demodulation is processing for removing the effects of such harmonics and subharmonics. By this demodulation, among the components included in the evaluation amount, the component with the same frequency ω as that of the dither signal M whose evaluation amount is changed is extracted.
デモジュレーションされた評価量は、ローパスフィルタ13に入力される。ローパスフィルタ13によって、評価量から定常成分(低周波成分)が抽出される。定常成分は、ディザー信号Mを作用させたことによって評価量が増加方向に変化したのか、又は減少方向に変化したのかを表すと考えられる。
The demodulated evaluation quantity is input to the low-
推定器14は、ローパスフィルタ13によって抽出された定常成分を積分する積分器である。推定器14は、定常成分の積分値に基づいて評価量を極小値に近づけるために動かすべき操作量の方向(以下「操作方向」という。)を推定する推定器として機能する。このような操作方向の推定方法は、適応制御系における操作方向の推定法として最も基本的な勾配法に基づくものである。推定器14によって操作方向(以下「勾配」ともいう。)が決定されると、その勾配に応じて評価量を極小値に近づけるように操作量が調整される。このように調整された操作量は、再びディザー信号を印加されて制御対象プロセスTPに入力される。
The
なお、ここでは、極小値を探索する場合を想定して極値制御システム9の構成例を説明したが、極大値を探索する場合には、推定器14が推定する勾配の符号を反転させればよい。
Here, an example of the configuration of the extreme
また、一般に積分器はローパス特性を有するため、推定器14が十分なローパス特性を有する場合には、極値制御システム9はローパスフィルタ13を備えなくてもよい。以下では、簡単のため、推定器14は十分なローパス特性を有し、ローパスフィルタ13の機能を包含するものとして説明する。
Also, since an integrator generally has a low-pass characteristic, the extremal
以下に説明する実施形態の最適制御装置は、上記の極値制御システム9を用いて構成され、制御対象プロセスを極値制御によって制御する装置として機能する。実施形態の最適制御装置は、操作量の入力に対して制御量を出力する任意のプロセスの制御に適用可能である。例えば、制御対象プロセスは、下水処理プロセスや燃焼プロセス、石油化学プロセスなどであってもよい。以下、生物学的排水処理プロセスを適宜例にとり実施形態の最適制御装置の詳細を説明する。
The optimum control device of the embodiment described below is configured using the above-described extreme
(第1の実施形態)
図3は、第1の実施形態における最適制御装置2の機能構成の具体例を示すブロック図である。図3に示すプラントPは制御対象プロセスを実現する手段の一例であり、例えば、生物学的排水処理プロセスを実現する水処理プラントである。プラントPは、制御対象プロセスを実現するための各種機器を含み、最適制御装置2によって与えられる操作量に基づいて各種機器を動作させる。また、プラントPは、操作量に対する制御対象プロセスの応答(すなわち制御量)を計測する各種の計測機器を含み、計測機器によって取得される計測データを制御対象プロセスの制御量を示す情報(以下「計測情報」という。)を最適制御装置2に出力する。最適制御装置2は、制御対象プロセスから取得される計測情報に基づいて、制御対象プロセスの評価量が最適値に近づくような操作方向で操作量を更新していく。このような動作は、最適制御装置2が以下のような構成を備えることによって実現される。
(First embodiment)
FIG. 3 is a block diagram showing a specific example of the functional configuration of the
最適制御装置2は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、極値制御プログラムを実行する。最適制御装置2は、極値制御プログラムの実行によってディザー信号出力部21、操作量出力部22、計測情報取得部23、評価量算出部24、勾配推定部25、パラメータ決定部26及び極値制御部27を備える装置として機能する。なお、最適制御装置2の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。制御プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。制御プログラムは、電気通信回線を介して送信されてもよい。
The
ディザー信号出力部21は、ディザー信号を生成し、生成したディザー信号を極値制御部27に出力する。具体的には、ディザー信号出力部21は、操作量のモジュレーションのためにディザー信号Mを生成し、評価量のデモジュレーションのためにディザー信号Dを生成する。
The dither
操作量出力部22及び計測情報取得部23は、最適制御装置2とプラントPとを通信可能に接続する通信インターフェースを含んで構成される。操作量出力部22は、極値制御部27から出力される操作量をプラントPに送信する。また、計測情報取得部23は、プラントPから計測情報を取得し、取得した計測情報が示す制御量を評価量算出部24に出力する。
The manipulated
評価量算出部24は、計測情報取得部23から出力される制御量に基づいて極値制御に用いられる評価量を算出する。評価量算出部24は、算出した評価量を勾配推定部25及び極値制御部27に出力する。
The
勾配推定部25は、評価量算出部24から出力される評価量に基づいて、評価関数の勾配を推定する。具体的には、勾配推定部25は、順次取得される評価量の変化に基づいて、操作量に対する1階からN階(Nは1以上の整数)までの勾配(すなわち微分値)を推定する。ここでは一例として1階微分値を推定する場合について説明する。ここで最適制御装置2の制御周期をTとし、制御周期Tごとの制御が行われる時刻を制御時刻という。この場合、勾配推定部25は、ある制御時刻tにおける評価量J(t)と、その1制御周期前の制御時刻t-Tにおける評価量J(t-T)との差を、両時刻における操作量U(t)及びU(t-T)の差で除することによって、操作量に対する評価量の1階微分値の近似値を取得することができる。すなわち、評価量の1階微分値dJ/dUは、次の式(1)のように近似される。
The
式(1)は、評価量の微分値を取得する方法の最も簡単な例を示したものであるが、実際には、このような方法で取得される1階微分値は評価関数や操作量の計測値又は算出値によるノイズの影響を受けやすい。また、2階以上の高階微分値を取得する場合にはノイズの影響が大きくなり、実質的に勾配を推定することができなくなる可能性が高い。このような問題に関して、以下に示す各文献には、ディザー信号が、通常、正弦波として与えられることに着目し、より精度良く勾配を推定する方法が提案されている。 Formula (1) shows the simplest example of a method of obtaining the differential value of the evaluation quantity. It is susceptible to noise due to measured or calculated values of In addition, when obtaining a high-order differential value of the second order or higher, the influence of noise increases, and there is a high possibility that the gradient cannot be estimated substantially. Regarding such a problem, the following documents propose a method of estimating the gradient with higher accuracy, focusing on the fact that the dither signal is usually given as a sine wave.
非特許文献1には、フィルタを用いた勾配推定法が記載されており、非特許文献2には、オブザーバの考え方を用いた勾配推定法が記載されている。本実施形態において、勾配推定部25は、このような従来技術に基づいて評価関数の勾配を推定することが望ましい。ここで、非特許文献1に記載された勾配推定法の基本的な考え方を説明する。
一般に、操作量には高調波成分や分調波成分が含まれる場合があるが、ディザー信号が正弦波で与えられる場合、操作量は概ねディザー信号と同じ周波数で正弦波状に変化する。そこで、操作量UがU(t)=U0+a×sinωtという正弦波状に変化すると仮定し、それによって得られる評価量が次の式(2)に示す評価関数Jで表されると仮定する。 In general, the manipulated variable may include harmonic components and subharmonic components, but when the dither signal is given as a sine wave, the manipulated variable changes sinusoidally at approximately the same frequency as the dither signal. Therefore, it is assumed that the manipulated variable U changes sinusoidally as U(t)=U 0 +a×sinωt, and that the evaluation value obtained by this change is represented by the evaluation function J shown in the following equation (2). .
ここで、fは未知の関数である。実際には、fにはプラントのダイナミクスが含まれるため、正確には、fは動的システムの作用素(オペレータ)とみなされるべきである。ただし、ディザー信号の周波数ωがプラントのダイナミクスに対して十分に緩やかな変化をもたらす場合には、fを近似的に関数とみなすことができる。このような前提の下、ここではfを関数とみなす。この式(2)をテーラー展開することにより次の式(3)が得られる。 where f is an unknown function. In practice, f contains the dynamics of the plant, so rather f should be considered the operator of the dynamic system. However, if the frequency ω of the dither signal provides a sufficiently gradual change in the dynamics of the plant, then f can be approximated as a function. Under this premise, f is regarded as a function here. The following equation (3) is obtained by Taylor-expanding this equation (2).
ここで、Dkf(kは1以上の整数)は、関数fのUに関するk階微分を意味する。この式(3)にsinnωt(nは1以上の整数)を掛けることにより次の式(4)が得られる。 Here, D k f (where k is an integer equal to or greater than 1) means the k-th differential of the function f with respect to U. The following equation (4) is obtained by multiplying this equation (3) by sin n ωt (where n is an integer of 1 or more).
ここで、式(4)に周期平均処理を行うと次の式(5)が得られる。 Here, the following equation (5) is obtained by performing the periodic averaging process on the equation (4).
ここで、A0は次の式(6)で定義される。 Here, A 0 is defined by the following equation (6).
ディザー信号の振幅aと冪数nは定数であることに着目し、n階微分Dnfの値が1制御周期で大きく変化しないと仮定しており、μnは次の式(7)で定義される。 Focusing on the fact that the amplitude a and the exponent n of the dither signal are constants, it is assumed that the value of the n -th order differential Dnf does not change significantly in one control cycle, and µn is given by the following equation (7): Defined.
続いて、次の式(8)及び(9)を定義し、式(5)の関係を用いると、0からn階までの微分D0f~Dnfは次の式(10)のように表される。 Subsequently, by defining the following equations (8) and (9) and using the relationship of the equation (5), the differentials D 0 f to D n f from 0 to nth order are as shown in the following equation (10) is represented by
ここで、Anは次の式(11)で定義される。 Here, An is defined by the following equation (11).
したがって、式(10)を用いることで任意の次数のn階微分値(或いは第0階~第n階微分値)を推定することができる。さらに非特許文献1には、このような基本的な考え方に沿って、若干の修正を加えたn階微分値の推定方法が記載されている。
Therefore, by using equation (10), it is possible to estimate the n-th order differential value (or the 0th to n-th order differential values) of any order. Furthermore,
図4は、第1の実施形態におけるn階微分値の推定方法の一具体例を示す図である。図4においてG(t)は次の式(12)で定義される。 FIG. 4 is a diagram showing a specific example of a method of estimating the n-order differential value in the first embodiment. In FIG. 4, G(t) is defined by the following equation (12).
ここで、X(t)は、図4のx1(t)~xn(t)を並べたベクトル信号である。すなわち式(12)は、式(5)及び(8)で定義した信号を、図4に示したX(t)で近似(代用)したものと考えることができる。 Here, X(t) is a vector signal in which x 1 (t) to x n (t) in FIG. 4 are arranged. That is, equation (12) can be considered as approximating (substituting) the signals defined by equations (5) and (8) with X(t) shown in FIG.
このように、フィルタを用いた勾配推定器G(t)で評価関数Jの勾配を推定することができる。本実施形態の最適制御装置2は、このような方法を用いて推定された勾配の推定値に基づいて極値制御の制御パラメータを決定する。勾配推定部25は、このようにして取得した勾配推定値をパラメータ決定部26に出力する。
Thus, the gradient of the evaluation function J can be estimated by the gradient estimator G(t) using a filter. The
図3の説明に戻る。パラメータ決定部26は、勾配推定部25によって取得された評価関数の勾配推定値に基づいて極値制御の制御パラメータを決定する。具体的には、パラメータ決定部26は、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する。
Returning to the description of FIG. The
図5は、第1の実施形態における制御パラメータの決定方法の一例を示す図である。具体的には、図5は、特許文献1に記載された制御パラメータの調整則を示す。この調整則は、基本的には、制御対象プロセスの制御に極値制御を適用する前の設計段階において制御パラメータを決定する際に用いられることを想定したものである。すなわち、特許文献1は、この調整則に基づいて決定された制御パラメータを極値制御の適用後に変更することを想定したものではない。
FIG. 5 is a diagram illustrating an example of a control parameter determination method according to the first embodiment. Specifically, FIG. 5 shows the control parameter adjustment rule described in
本実施形態の最適制御装置2において、パラメータ決定部26は、図5に示す5つのパラメータのうち積分ゲイン以外のパラメータについては、図5に示すNo.1~No.4の各調整則に基づいて決定する。一方、積分ゲインについては、パラメータ決定部26は、勾配推定部25によって取得された勾配推定値に基づいて、制御対象プロセスの状態に応じて適応的に決定し、極値制御に反映させる。積分ゲインの決定方法については後述する。
In the
図3の説明に戻る。極値制御部27は、パラメータ決定部26によって決定された制御パラメータで、制御対象プロセスの極値制御を行う。具体的には、まず、極値制御部27は、プラントPに与える操作量にディザー信号を印加し、それによって変化する評価量を観測する。そして、極値制御部27は、評価量の観測値に基づいて、評価量を最適値に近づけるように操作量を更新する。極値制御部27が、ディザー信号の印加、評価量の観測及び操作量の更新を繰り返し実行することで、制御対象プロセスの評価量が最適値に近づけられる。
Returning to the description of FIG. The extreme
図6は、第1の実施形態の最適制御装置2によって実現される極値制御システム1の構成例を示すブロック線図である。極値制御システム1が図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25によって取得された評価関数の勾配推定値が推定器14の動作に適応的に作用する点である。具体的には、パラメータ決定部26(図示せず)が勾配推定値に基づいて算出した積分ゲインKIが適応的に推定器14に反映される。これにより、最適制御装置2は、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。積分ゲインの決定方法の詳細は後述する。
FIG. 6 is a block diagram showing a configuration example of the extreme
なお、図6に示す極値制御システム1は、図3に示した最適制御装置2のディザー信号出力部21及び極値制御部27として機能する。また、極値制御システム1は、操作量出力部22、計測情報取得部23及び評価量算出部24を含むように構成されてもよい。
The extreme
図7は、第1の実施形態におけるプラントPの一例として、生物学的排水処理プロセスを実現する水処理プラント3の具体例を示す図である。例えば、図7に示す水処理プラント3は、嫌気槽31、無酸素槽32、好気槽33及び最終沈澱池34の各設備を備える。嫌気槽31は、微生物を活性化させるための設備である。無酸素槽32は、窒素を除去するための設備である。好気槽33は有機物の分解やリンの除去、アンモニアの硝化を行うための設備である。最終沈澱池34は、活性汚泥を沈殿させるための設備である。
FIG. 7 is a diagram showing a specific example of a
水処理プラント3には、上記設備間で水や汚泥を搬送するポンプや、槽内に空気を供給するブロワ、空気中又は水中の物質の濃度を計測するセンサー等の設備が設置される。薬品投入ポンプ311は、微生物を活性化させる炭素源等の薬品を嫌気槽31に投入するポンプである。循環ポンプ331は、好気槽33と無酸素槽32との間で循環する被処理水の循環量を制御するポンプである。ブロワ332は、好気槽33に空気を供給して曝気量を制御する。返送汚泥ポンプ341は、最終沈澱池34から無酸素槽32に汚泥を返送するポンプである。余剰汚泥引き抜きポンプ342は、最終沈澱池34から過剰な汚泥を引き抜くポンプである。センサー312及びセンサー343は、それぞれ、嫌気槽31及び最終沈澱池34における放流水の水質を計測する。
The
一般に、このような生物学的廃水処理プロセスでは、操作量は返送汚泥の返送率であり、制御量は放流水に含まれる窒素及びリンの濃度(以下それぞれを「放流窒素濃度」及び「放流リン濃度」という。)である。返送率は、返送汚泥ポンプ341の放流量を流入量で割ることによって得られる。放流窒素濃度及び放流リン濃度は、センサー312及びセンサー343によって取得される。なお、制御量を、放流水に含まれる窒素及びリンの量(以下それぞれを「放流窒素量」及び「放流リン量」という。)としてもよい。この場合、放流窒素量及び放流リン量は、それぞれ放流窒素濃度及び放流リン濃度に放流量を乗算することにより得られる。
In general, in such a biological wastewater treatment process, the manipulated variable is the return rate of the returned sludge, and the controlled variable is the concentration of nitrogen and phosphorus contained in the effluent (hereinafter referred to as "effluent nitrogen concentration" and "effluent phosphorus concentration", respectively). concentration”). The return rate is obtained by dividing the discharge rate of the
評価量算出部24には、水処理プラント3から出力される制御量に基づいて評価量を取得するための評価関数を予め設定しておく。ここでいう評価関数は、操作量に対する未知の評価関数を、制御量の関数として定義したものである。例えば、評価関数は、放流窒素濃度及び放流リン濃度と評価量との関係を表す関数である。この評価関数は、操作量(返送率)上限での制御量と、操作量下限での制御量との間で極値をとるように設定される必要がある。このように評価関数を設定する方法の一例として、評価量を排水賦課金の考え方に基づく水質コストと、返送汚泥ポンプ341の電力コストとの総和(以下「総コスト」という。)として表す方法が考えられる。返送汚泥ポンプ341の電力コストは、返送汚泥流量と返送汚泥ポンプ341の定格電力などから算出することができる。一般に、排水賦課金の考え方では、水質コストは以下の式で表される。
An evaluation function for obtaining an evaluation amount based on the control amount output from the
式(13)においてCODは化学的酸素要求量、BODは生物化学的酸素要求量、TNは放流窒素、TPは放流リンを意味する。各コストの換算係数は、実際の排水賦課金に基づいて決定されても良いし、他の方法によって決定されてもよい。一般に、COD、BOD、TN及びTPのうち、返送率を変えることによって大きく変化するものはTN及びTPであることが知られている。そのためここでは、水質コストを次の式(14)で表す。 In formula (13), COD means chemical oxygen demand, BOD means biochemical oxygen demand, TN means effluent nitrogen, and TP means effluent phosphorus. The conversion factor for each cost may be determined based on the actual waste water charge, or may be determined by other methods. Generally, among COD, BOD, TN and TP, it is known that TN and TP are greatly changed by changing the return rate. Therefore, here, the water quality cost is represented by the following equation (14).
なお、一般に、返送率を上げると窒素の除去率が高まりTNに関する水質コストが減少し、逆に返送率を下げるとリンの除去率が高まりTPに関する水質コストが減少することが知られている。このような場合、水質コストのみに基づいて評価関数が設定されても良い。ただし、このようなトレードオフの関係を持たない水質同士のコストを指標とする場合には、評価量を、運転コスト(電力コスト)を加味した総コストとして表すことにより、評価関数が、操作量(返送率)上限での制御量と操作量下限での制御量との間で極値をとるように設定する。 It is generally known that increasing the return rate increases the nitrogen removal rate and reduces the water quality cost related to TN, and conversely, decreasing the return rate increases the phosphorus removal rate and reduces the water quality cost related to TP. In such a case, the evaluation function may be set based only on the water quality cost. However, when the cost of water quality that does not have such a trade-off relationship is used as an index, by expressing the evaluation amount as a total cost that takes into account the operation cost (electricity cost), the evaluation function can be expressed as the operation amount (Return rate) Set so as to take an extreme value between the controlled variable at the upper limit and the controlled variable at the manipulated variable lower limit.
また、評価関数には、このような総コストではなく、直接的に水質の評価を表す関数が設定されてもよい。例えば、評価量は、次の式(15)のように算出されてもよい。 Moreover, instead of such a total cost, a function that directly expresses the evaluation of water quality may be set as the evaluation function. For example, the evaluation amount may be calculated as in Equation (15) below.
式(15)において、TNlim及びTPlimは、放流水質の規制値や管理値に相当するスレッシホールドレベルを表すパラメータである。このような評価関数を用いた場合、スレッシホールドレベルを超えると評価量が急上昇する。そのため、評価量をスレッシホールドレベル以内に抑えるように極値制御が機能することが期待できる。 In Equation (15), TN lim and TP lim are parameters that represent threshold levels corresponding to regulation values and management values for effluent water quality. When such an evaluation function is used, the evaluation amount rises sharply when the threshold level is exceeded. Therefore, it can be expected that extremal value control functions so as to keep the evaluation quantity within the threshold level.
以上、図4に示したような水処理プラント3を例として、極値制御に必要となる評価関数の設定方法について説明したが、制御対象とするプラントPによっては評価関数の設定を必要としない場合もある。そのような例として、風力発電プラントにおける風車のブレードの制御が挙げられる。風車のブレードの向きを風向に併せて動かすことにより発電量を最大化するような制御に極値制御を適用する場合、評価量は発電量であり、操作量は風車のブレードの回転角となる。この場合、制御量がそのまま評価量となるため評価関数の設定を必要としない。このような場合、評価量算出部24が設けられなくてもよい。その一方で、評価量を取得することによって、極値制御の適用が可能となる場合もある。
The method of setting the evaluation function required for extreme value control has been described above using the
[積分ゲインの決定方法]
以下、パラメータ決定部26が勾配推定値に基づいて積分ゲインを決定する方法について説明する。特許文献1で提案されている上記の調整則は、非特許文献3に記載されたアベレージシステムに基づくものである。アベレージシステムとは、あるシステムに周期的な入力が加えられたときに、その周期平均(アベレージ)をとったシステムの動的な挙動を表すシステムであり、極値制御系の安定解析に用いられる。
[Determination method of integral gain]
The method by which the
特に非特許文献3には、ダイナミクスを持たないスタティックなプラントを制御対象とする極値制御系のアベレージシステムについて具体的に記載されている。そのアベレージシステムは、次の式(16)で表される。
In particular,
ただし、DJは評価関数Jの入力の周期平均U-U*に関する勾配を表す。U*はUの平衡点である。τはディザー信号の周波数ωでスケール変換された時間関数であり、次の式(17)によって表される値である。 where DJ represents the slope of the input of the evaluation function J with respect to the periodic mean UU * . U * is the equilibrium point of U. τ is a scaled function of time at the frequency ω of the dither signal and is a value represented by the following equation (17).
また、KI0は時間軸τ上での積分ゲインであり、実際の時間軸t上での積分ゲインKIは次の式(18)によって変換される。 KI 0 is the integral gain on the time axis τ, and the actual integral gain KI on the time axis t is converted by the following equation (18).
なお、式(16)におけるPはディザー信号のパワーを表す。非特許文献3に記載されているように、ディザー信号として正弦波を用いる場合にはP=1/2であり、三角波の場合はP=1/3であり、矩形波の場合はP=1である。式(16)が示すアベレージシステムは、ディザー信号で操作量を周期的に振動させながら、評価量を最小値(極小値)に収束させていくとき、評価量が周期的に振動しながらどのような速さで最小値(極小値)収束していくかという極値制御の収束のダイナミクスを表現したものである。
Note that P in Equation (16) represents the power of the dither signal. As described in
非特許文献3では、プラントがスタティックである場合を仮定し、ディザー信号の周期がプラントの時定数よりも十分に長く設定されている。これはすなわち、ディザー信号の周波数ωがプラントのカットオフ周波数2π/ωよりも十分に小さく設定されている場合である。このような場合には、プラントがダイナミクスを持っている場合であっても、これを近似的にスタティックであるとみなせる。このことは、極値制御の安定解析に用いられる特異摂動論によって裏付けられる。したがって、ここでは、ディザー信号の周波数ωが適切に設定されているという想定の下で式(16)のアベレージシステムを用いて積分ゲインを決定する方法を示す。
In
式(16)は、ディザー信号の周波数でスケール変換された時間軸τ=ωtでの極値制御系の挙動を示すため、式(16)の時定数は、極値制御が極値に収束するまでの時間軸τでの時定数に対応すると考えられる。したがって、式(16)で表されるアベレージシステムの時定数Taveが、ディザー信号の周期T=2π/ωより十分長くなるようにパラメータω、a、KI0を決定すれば、評価量はディザー信号による操作量の増減に応じて徐々に最小値(極小値)に収束していくと期待される。 Equation (16) shows the behavior of the extremal control system on the time axis τ=ωt scaled by the frequency of the dither signal. It is thought that it corresponds to the time constant on the time axis τ until . Therefore, if the parameters ω, a, and KI0 are determined so that the time constant T ave of the average system represented by Equation (16) is sufficiently longer than the dither signal period T=2π/ω, the evaluation amount is dither It is expected to gradually converge to the minimum value (minimum value) according to the increase/decrease of the manipulated variable by the signal.
ここで、ディザー信号の周波数ωと振幅aは図5の調整則に基づいて決定されるため、アベレージシステムの時定数がディザー信号の周期T=2π/ωより十分に長くなるようにするためにはKI0を調整することになる。しかしながら、式(16)は一般的には非線形の微分方程式となるため、時定数という概念を直接的に定義することができない。そこで、特許文献1では、評価関数Jが二次関数であるとの想定の下で時定数を定義して制御パラメータを決定する調整則が提案されている。例えば、評価関数J(t)が次の式(19)で表される場合を想定する。
Here, since the frequency ω and the amplitude a of the dither signal are determined based on the adjustment rule of FIG. will adjust KI 0 . However, since Equation (16) is generally a nonlinear differential equation, the concept of time constant cannot be defined directly. Therefore,
この場合、DJ(U+U*)=G×U(t)となるため、式(14)は次の式(20)のように表される。 In this case, DJ(U+U * )=G×U(t), so equation (14) is expressed as the following equation (20).
式(20)の時定数Taveは、1/(KI0×a×P×G)となる。このTaveは時間軸τ上での時定数であり、τ=1は1/ωに相当する時間である。このことから、時定数Taveに相当する時間をディザー信号の周期2π/ωの何倍にするかが決まればKI0の値を決定することができる。ここで、アベレージシステムの時定数がディザー信号の周期より十分に長くなるように調整される必要があることから、例えば、時定数に相当する時間を、ディザー信号の周期のk3(=5~10)倍程度とする。この場合、k3×2π=1/(KI0×a×P×G)が成立するため、KI0は次の式(21)のように決定される。 The time constant T ave of Equation (20) is 1/(KI 0 ×a×P×G). This Tave is a time constant on the time axis τ, and τ=1 is the time corresponding to 1/ω. Therefore, the value of KI 0 can be determined by determining how many times the period 2π/ω of the dither signal should be set for the time corresponding to the time constant T ave . Here, since the time constant of the average system needs to be adjusted to be sufficiently longer than the period of the dither signal, for example, the time corresponding to the time constant is set to k3 (=5 to 10) of the period of the dither signal. ). In this case, k3×2π=1/(KI 0 ×a×P×G) holds, so KI 0 is determined by the following equation (21).
特許文献1には、以上のような積分ゲインの調整則が提案されているが、この調整則は上述したとおり評価関数J(t)が二次関数であるとの想定に基づくものである。しかしながら、現実の問題がこのような想定の範囲内にあることはほとんど期待できない。これに対して、特許文献1には評価関数を二次関数で近似できるように変換する方法も提案されているが、このような変換を行うためには予め操作量と評価量との関係性をある程度明らかにしておく必要がある。そして、このような関係性の取得には、制御対象プロセスについていくつかの動作点の観測が必要となり、多大なエンジニアリングコストを要する。
このような課題に対して、本実施形態では式(19)及び(21)におけるGが評価関数の二階微分値であることに着目し、パラメータ決定部26が勾配推定部25によって取得される二階微分の推定値を式(21)に適用することで積分ゲインを決定する。なお、評価関数J(t)が二次関数である場合にはGは定数となるが、現実の問題のほとんどにおいて評価関数J(t)は二次関数でない。このように評価関数J(t)が二次関数でない場合、Gは時間とともに変化する関数となる。そのため、この場合、積分ゲインは次の式(22)のように表される。
To address this problem, the present embodiment focuses on the fact that G in equations (19) and (21) is the second-order differential value of the evaluation function, and the
式(19)において、G(t)は勾配推定部25によって推定された評価関数の操作量に対する二階微分値である。また、式(19)は、積分ゲインが時刻tにおける二階微分値G(t)によって時間tの関数となることを表している。すなわち、パラメータ決定部26は、順次取得される勾配推定値を式(22)に適用することにより、経時的に変化する制御対象プロセスのダイナミクスに適応して積分ゲインを更新することができる。
In Equation (19), G(t) is the second order differential value with respect to the manipulated variable of the evaluation function estimated by the
図8は、第1の実施形態における最適制御装置2が制御対象プロセスを極値制御によって制御する処理の流れを示すフローチャートである。なお、プラントPの制御対象プロセスは、フローチャートの開始時点においてPID制御等の極値制御以外の制御方法で制御されているものとする。まず、計測情報取得部23は、プラントPから計測情報を取得する(ステップS101)。計測情報取得部23は、計測情報が示す制御量を評価量算出部24に出力する。
FIG. 8 is a flow chart showing the flow of processing in which the
評価量算出部24は、計測情報取得部23から出力された制御量に基づいて、制御対象プロセスのその時点における評価量を算出する(ステップS102)。評価量算出部24は、算出した評価量を勾配推定部25及び極値制御部27に出力する。
The evaluation
勾配推定部25は、評価量算出部24から出力された評価量に基づいて評価関数の勾配を推定する(ステップS103)。勾配推定部25は、取得した勾配推定値をパラメータ決定部26に出力する。
The
パラメータ決定部26は、勾配推定部25から出力された勾配推定値と、予め定められた制御パラメータの調整則とに基づいて制御パラメータを決定する(ステップS104)。具体的には、パラメータ決定部26は、図5のNo.1~No.4に示す調整則に基づいてハイパスフィルタ11の周波数ω1、ディザー信号出力部12が出力するディザー信号の周波数ω及び振幅a、及びローパスフィルタ13の周波数ω2を決定する。なお、図5に示す調整則でこれらの制御パラメータを決定する際に必要な情報(例えば、制御対象プロセスの時定数やむだ時間など)は、計測情報に基づいて取得されてもよいし、予め最適制御装置2に記憶されていてもよい。
The
一方で、パラメータ決定部26は、勾配推定部25から出力された勾配推定値を式(22)に適用して積分ゲインKI0を決定する。パラメータ決定部26は、このように決定した制御パラメータの値を極値制御部27に出力する。
On the other hand, the
続いて、極値制御部27が、パラメータ決定部26によって決定された各制御パラメータを用いて、制御対象プロセスの極値制御を開始する(ステップS105)。ここでは、パラメータ決定部26によって制御パラメータが決定された後、所定のタイミングで、制御対象プロセスの制御方法が極値制御に切り替えられるものとする。このタイミングは予め定められたタイミングであってもよいし、ユーザの操作による任意のタイミングであってもよい。
Subsequently, the extreme
極値制御部27が極値制御を開始した後、最適制御装置2は、ステップS101、S102及びS103と同様の処理を繰り返し実行する(ステップS106、S107及びS108)とともに、ステップS104と同様の方法で積分ゲインの値を取得する(ステップS109)。そして、パラメータ決定部26は、取得した積分ゲインの値で現在の積分ゲインの値を更新する(ステップS110)。
After the extreme
このように構成された第1の実施形態の最適制御装置2は、取得される計測情報に基づいて評価関数の勾配を推定するとともに、取得した勾配推定値に基づいて積分ゲインを適応的に決定する機能を有する。このような最適制御装置2によれば、極値制御の安定性に大きく関係する積分ゲインを制御対象プロセスの状態に応じて適応的に更新することができるため、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
The
このように制御パラメータを調整することができる最適制御装置2によれば、例えば図7の水処理プラントにおける汚泥の返送量を操作量として、水処理プロセスのダイナミクスに適応しながら総コストを最小化するような極値制御を実現することが可能となる。
According to the
(第2の実施形態)
図9は、第2の実施形態における最適制御装置2aの機能構成の具体例を示すブロック図である。最適制御装置2aは、勾配推定部25に代えて勾配推定部25aを備える点、パラメータ決定部26に代えてパラメータ決定部26aを備える点、操作量変換部28をさらに備える点で第1の実施形態における最適制御装置2と異なる。最適制御装置2aのその他の構成は第1の実施形態における最適制御装置2と同様である。そのため、ここでは、それらの同様の構成には図3と同じ符号を付すことにより説明を省略する。
(Second embodiment)
FIG. 9 is a block diagram showing a specific example of the functional configuration of the
勾配推定部25aは、取得された評価量に基づいて評価関数の勾配を推定する点では第1の実施形態における勾配推定部25と同様であるが、評価関数の勾配として二階微分値ではなく一階微分値を推定する点、取得した勾配推定値をパラメータ決定部26aではなく、操作量変換部28に出力する点で勾配推定部25と異なる。
The
パラメータ決定部26aは、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する点では第1の実施形態におけるパラメータ決定部26と同様であるが、積分ゲインの決定に評価関数の勾配推定値を用いない点でパラメータ決定部26と異なる。
The
操作量変換部28は、勾配推定部25aから出力される評価関数の勾配推定値に基づいて極値制御部27から出力される操作量を変換する。操作量変換部28は、変換した操作量を操作量出力部22に出力する。具体的には、操作量変換部28は、以下のような方法で操作量を変換する。
The manipulated
まず、極値制御部27から出力される操作量をUとすると、Uを入力(操作量)とした場合の極値制御のアベレージシステムは上記の式(16)で表される。以下、式(23)として式(16)を再掲する。
First, assuming that the manipulated variable output from the extreme
式(23)において評価関数の勾配DJ(U+U*)は、一般的にはUに関する非線形関数となるため、式(23)の収束の速さを時定数の概念で表現することができなかった。そこで、第1の実施形態では、まず、評価関数J(U)が二次関数で表されると仮定した上で時定数の概念を定義し、定義した時定数が所望の値になるように積分ゲインKI0を決定した。しかしながら、実際には,評価関数J(U)は二次関数ではないため、その二階微分値が一定となるように積分ゲインKI0を適応的に調整した。 In equation (23), the gradient DJ (U+U * ) of the evaluation function is generally a nonlinear function with respect to U, so the speed of convergence in equation (23) could not be expressed by the concept of time constant. . Therefore, in the first embodiment, first, the concept of the time constant is defined on the assumption that the evaluation function J(U) is represented by a quadratic function, and the defined time constant is set to a desired value. The integral gain KI 0 was determined. However, since the evaluation function J(U) is not actually a quadratic function, the integral gain KI 0 is adaptively adjusted so that the second derivative value is constant.
これに対して、本実施形態では、式(23)によって表されるアベレージシステムが線形システムとなるように入力変数Uを変数変換することで時定数を定義する。すなわち、変換後の変数vに関するアベレージシステムが線形システムとなるように次の式(24)に示す変数変換を行う。この変数変換により、変数vに関するアベレージシステムは次の式(25)のように変換される。 On the other hand, in this embodiment, the time constant is defined by transforming the input variable U so that the average system expressed by Equation (23) becomes a linear system. That is, the variable conversion shown in the following equation (24) is performed so that the average system for the variable v after conversion becomes a linear system. By this variable transformation, the average system for the variable v is transformed as shown in the following equation (25).
ここで、式(23)を式(25)に変換する関数v=h(U)は次の式(26)に示す偏微分方程式を満たす必要がある。 Here, the function v=h(U) for converting equation (23) to equation (25) must satisfy the partial differential equation shown in equation (26) below.
この条件を満たす変換関数hは多数存在するが、評価関数の一階微分値DJ(U)が既知であれば、どのような微分方程式であっても少なくとも近似的には解くことが可能である。例えば、式(26)を次の式(27)のように近似することができる。 There are many transformation functions h that satisfy this condition, but if the first derivative value DJ(U) of the evaluation function is known, any differential equation can be solved at least approximately. . For example, Equation (26) can be approximated by Equation (27) below.
このように近似した式(27)を用いれば、例えば、初期値の操作量U0に対して適当な変換v0=h(U0)を与えることができれば、極値制御による操作量の変化に応じてh(U)を更新していくことができる。操作量変換部28は、勾配推定部25aによって取得された勾配推定値(一階微分値)を式(27)に適用することによって操作量を変換することができる。
Using equation (27) approximated in this way, for example, if an appropriate transformation v 0 =h (U 0 ) can be given to the initial value of the manipulated variable U 0 , the change in the manipulated variable by extreme value control h(U) can be updated accordingly. The manipulated
また、変数vの初期値v0については、DJ(U)がUの一次関数で近似できる場合には、次の式(28)によって変換することで、近似的に式(22)を成立させることができる。 Further, regarding the initial value v 0 of the variable v, when DJ(U) can be approximated by a linear function of U, the following formula (28) is used to approximate the formula (22). be able to.
なお、式(25)は、式(20)が示すアベレージシステムにおいて評価関数の二階微分値GをG=1としたものに相当する。そのため、積分ゲインは、式(22)のGをG=1として算出されればよい。 Equation (25) corresponds to the average system represented by Equation (20) in which the second-order differential value G of the evaluation function is set to G=1. Therefore, the integral gain may be calculated by setting G in Equation (22) to G=1.
図10は、第2の実施形態の最適制御装置2aによって実現される極値制御システム1aの構成例を示すブロック線図である。極値制御システム1aが図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25aによって取得された評価関数の勾配推定値(一階微分値)(図中の()n)が制御対象プロセスTPに与えられる操作量に適応的に作用する点である。具体的には、操作量変換部28(図示せず)が勾配推定値に基づいて変換した操作量が制御対象プロセスTPに与えられる。これにより、最適制御装置2aは、第1の実施形態の最適制御装置2と同様に、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
FIG. 10 is a block diagram showing a configuration example of an extreme
さらに、第2の実施形態では勾配推定値として評価関数の一階微分値を取得すればよいため、二階微分値を取得する第1の実施形態よりも、極値制御の処理を簡単にすることができる。具体的には、図4に示したようなフィルタを用いた勾配の推定において、フィルタの段数を少なくすることができるため、勾配推定部25を第1の実施形態よりも簡単な回路構成で実現することができる。また、このことは、フィルタ後段のG(t)をより小さい次元で実現できることを意味する。 Furthermore, in the second embodiment, it is sufficient to obtain the first derivative of the evaluation function as the gradient estimation value, so that the extreme value control processing can be made simpler than in the first embodiment in which the second derivative is obtained. can be done. Specifically, in estimating a gradient using a filter such as that shown in FIG. 4, the number of filter stages can be reduced. can do. This also means that G(t) after the filter can be realized in smaller dimensions.
また、その一方で、第2の実施形態では、操作量を変換する際の初期値を適切に設定するために多少の手間がかかる可能性がある。そのため、どちらの実施形態を用いるかは、適用する対象のプロセスの特性や制約事項等に応じて選択されるとよい。 On the other hand, in the second embodiment, it may take some time and effort to appropriately set the initial value when converting the manipulated variable. Therefore, which embodiment should be used should be selected according to the characteristics, restrictions, etc. of the target process to be applied.
(第3の実施形態)
図11は、第3の実施形態における最適制御装置2bの機能構成の具体例を示すブロック図である。最適制御装置2bは、評価量算出部24に代えて評価量算出部24bを備える点、勾配推定部25に代えて勾配推定部25bを備える点、パラメータ決定部26に代えてパラメータ決定部26bを備える点、評価量変換部29をさらに備える点で第1の実施形態における最適制御装置2と異なる。最適制御装置2bのその他の構成は第1の実施形態における最適制御装置2と同様である。そのため、ここでは、それらの同様の構成には図3と同じ符号を付すことにより説明を省略する。
(Third embodiment)
FIG. 11 is a block diagram showing a specific example of the functional configuration of the
評価量算出部24bは、計測情報取得部23から出力される制御量に基づいて極値制御に用いられる評価量を算出する点では第1の実施形態における評価量算出部24bと同様であるが、算出した評価量を勾配推定部25b及び評価量変換部29に出力する点で評価量算出部24と異なる。
The evaluation
勾配推定部25bは、取得された評価量に基づいて評価関数の勾配を推定する点では第1の実施形態における勾配推定部25と同様であるが、取得した勾配推定値をパラメータ決定部26bではなく、評価量変換部29に出力する点で勾配推定部25と異なる。
The
評価量変換部29は、勾配推定部25bから出力される評価関数の勾配推定値に基づいて評価量算出部24bから出力される評価量を変換する。評価量変換部29は、変換した評価量を極値制御部27に出力する。具体的には、評価量変換部29は、以下のような方法で評価量を変換する。
The evaluation
図12は、第3の実施形態におけるn階微分値の推定方法の一例を示す図である。まず、評価量変換部29に対して、評価量を変換するための変換関数を予め決定しておく。ここでは、簡単のため、評価関数Jを冪乗変換することにより、変換後の評価関数Jを局所的に二次関数で近似する。ここで、変換後の評価関数をJm、変換に用いる冪数(以下「冪乗パラメータ」という。)をnとするとJmはJm=T(J)=Jnと表すことができる。この冪乗パラメータnは以下のように推定することができる。
FIG. 12 is a diagram showing an example of a method of estimating the n-order differential value in the third embodiment. First, a conversion function for converting the evaluation amount is determined in advance for the evaluation
Jm=Jnと変換する場合、操作量Uに関するJの勾配も同じ変換関数で変換されるため、D2Jm=(D2J)nとなる。このとき、D2Jmが一定値となるように冪乗パラメータnを定めれば、変換後の評価関数の二階微分値は一定値となるため、変換後の評価量は二次関数で近似されたとみなすことができる。そこで、評価量変換部29は、入力された評価量に基づいて取得される評価関数の二階微分値が予め定められた所定の定数C=1となる冪数を算出することによって冪乗パラメータnを推定する。図12は、このような評価量変換部29の構成を示す概念図である。
When converting J m =J n , the gradient of J with respect to the manipulated variable U is also converted by the same conversion function, so D 2 J m =(D 2 J) n . At this time, if the power parameter n is determined so that D 2 J m is a constant value, the second derivative value of the evaluation function after conversion will be a constant value, so the evaluation amount after conversion is approximated by a quadratic function. can be considered to have been Therefore, the evaluation
具体的には、評価量変換部29は、推定器291及び変換部292を備える。推定器291は、定数C=1を評価関数の二階微分値の目標値として、変換関数D2Jm=(D2J)nを満たす冪数nを探索し、探索結果を最終的な冪乗パラメータの値として変換部292に出力する。変換部292は、推定器291によって推定された冪乗パラメータnを評価量の変換関数に適用して評価量Jを変換する。変換部292は、変換後の評価量Jmを極値制御部27に出力する。
Specifically, the evaluation
例えば、冪乗パラメータの推定を最急降下法のような方法で推定する場合、推定器291を、積分器を用いて構成することができる。また、推定器291は、冪乗パラメータnを仮想的な操作量とみなして、目標値である定数C=1と二階微分値D2Jm=(D2J)nとの誤差をゼロにするようなPID制御器を用いて構成されてもよい。
For example, if the power parameter is estimated by a method such as the method of steepest descent, the
なお、ここでは、勾配推定部25bによって二階微分値が推定される場合について説明したが、勾配推定部25bが一階微分値を推定する場合には、評価量変換部29は、その勾配推定値が操作量に対して比例するように評価量を変換するように構成されてもよい。
Here, the case where the
ただし、推定器291の目標値を定数C=1とした場合には、図5に示した調整則において評価関数の勾配G(二階微分値)をG=1と仮定して積分ゲインを決定する。もし、推定器291の目標値を定数C=Gとした場合には、定数Cの値を用いて積分ゲインを決定する。
However, when the target value of the
図11の説明に戻る。パラメータ決定部26bは、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する点では第1の実施形態におけるパラメータ決定部26と同様であるが、積分ゲインの決定に評価関数の勾配推定値を用いない点でパラメータ決定部26と異なる。
Returning to the description of FIG. The
図13は、第3の実施形態の最適制御装置2bによって実現される極値制御システム1bの構成例を示すブロック線図である。極値制御システム1bが図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25bによって取得された評価関数の勾配推定値(一階微分値又は二階微分値)が制御対象プロセスTPの制御量に基づいて取得される評価量に適応的に作用する点である。具体的には、評価量変換部29(図示せず)が勾配推定値に基づいて変換した評価量が極値制御システム1bに入力される。これにより、最適制御装置2bは、第1の実施形態の最適制御装置2と同様に、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
FIG. 13 is a block diagram showing a configuration example of an extreme
図14は、第1~第3の実施形態の最適制御装置によって得られる効果の具体例を示す図である。図14(A)は、実際には未知の評価関数の形状が二次関数、三次関数及び0.5次関数であると仮定し、従来の調整則で調整した制御パラメータに基づく極値制御をシミュレーションした結果を示す。また、図14(B)は、同仮定の下で、本実施形態の調整方法で調整された制御パラメータに基づく極値制御をシミュレーションした結果を示す。具体的には、図14(A)のシミュレーションにおいては、特許文献1に記載された調整則に基づいて制御パラメータを調整した。図14(A)を見ても分かるように、従来の調整方法では、評価関数の形状が二次関数や三次関数である場合には極値探索に成功しているものの、評価関数の形状が0.5次関数である場合には探索性能が著しく劣化している。一方、本実施形態の調整方法では、図14(B)を見ても分かるように、評価関数の形状に関わらず極値の探索成功している。
FIG. 14 is a diagram showing a specific example of effects obtained by the optimum control devices of the first to third embodiments. FIG. 14(A) assumes that the shape of the unknown evaluation function is actually a quadratic function, a cubic function, and a 0.5th order function, and performs extreme value control based on the control parameters adjusted by the conventional adjustment rule. A simulation result is shown. Further, FIG. 14B shows the result of simulating extreme value control based on the control parameters adjusted by the adjustment method of the present embodiment under the same assumption. Specifically, in the simulation of FIG. 14A, the control parameters were adjusted based on the adjustment rule described in
実際の極値制御においては最適化したい評価関数の形状を予め知ることができない。そのため、従来の制御パラメータの調整方法では、評価関数の形状に依存して、極値(局所的な最適値)の探索性能が変化し、最悪の場合には制御が不安定になる可能性もあった。これに対して、本実施形態における制御パラメータの調整方法によれば、評価関数の形状がどのような形状であっても常に安定的に極値を探索することが可能になる。 In actual extreme value control, the shape of the evaluation function to be optimized cannot be known in advance. Therefore, in the conventional control parameter adjustment method, the search performance for extreme values (local optimum values) changes depending on the shape of the evaluation function, and in the worst case, the control may become unstable. there were. In contrast, according to the control parameter adjustment method of the present embodiment, it is possible to always stably search for the extreme value regardless of the shape of the evaluation function.
(変形例)
第1の実施形態の最適制御装置2は、勾配推定部25によって推定された評価関数の勾配を示す勾配情報と、極値制御部27によって決定された操作量を示す操作量情報と、を対応づけて、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示装置に表示させるための情報(以下「表示情報」という。)を生成する表示制御部(図示せず)を備えてもよい。図15は、変形例の最適制御装置2において表示情報によって表示される画面の具体例を示す図である。表示情報は、図15(A)に示すように、時間軸に対して各値を別系列で示すものであってもよいし、各値を一つの系列で示すものであってもよい。また、表示情報は、図15(B)に示すように、一方又は両方の値を相関する他の値に置き換えた形で各値を表示するものであってもよい。図15(B)は、勾配情報を、評価量を示す情報で置き換えた例である。なお、図15に示されるように、表示情報には、現在の動作点や現在時刻などを示す情報が含まれてもよい。
(Modification)
The
なお、この場合、最適制御装置2は、表示情報を表示させるための表示装置を備えてもよいし、これらの表示装置を自装置に接続するインターフェースを備えてもよい。また、最適制御装置2は、表示情報を他の装置に送信するための通信インターフェースを備えてもよい。また、表示制御部は、第1の実施形態の最適制御装置2と同様に、第2又は第3の実施形態における最適制御装置2a又は2bに備えられてもよい。なお、第2の実施形態においては、表示される操作量は、極値制御部27によって決定された操作量であってもよいし、操作量変換部28によって変換された操作量であってもよい。
In this case, the
以上説明した少なくともひとつの実施形態によれば、制御対象プロセスに関して観測される評価量に基づいて、操作量に対する評価量を示す未知の評価関数の変化率を示す勾配を推定する勾配推定部と、勾配推定部によって取得された勾配の推定値に基づいて、極値制御の実行に必要な制御パラメータ、操作量又は評価量を、評価関数の変化に適応して補正する補正部と、を持つことにより、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる。 According to at least one embodiment described above, a gradient estimator for estimating a gradient indicating a rate of change of an unknown evaluation function indicating an evaluation amount with respect to a manipulated variable based on an evaluation amount observed for a controlled process; a correction unit that adapts to changes in the evaluation function and corrects the control parameter, the manipulated variable, or the evaluation amount necessary for executing extreme value control based on the estimated value of the gradient obtained by the gradient estimator; Therefore, extremal control can be operated more stably by adapting to the dynamics of the controlled process.
なお、第1の実施形態においては、勾配推定値に基づいて推定器14の積分ゲインを適応的に更新するパラメータ決定部26が上記補正部の一例である。また、第2の実施形態においては、勾配推定値に基づいて操作量を適応的に変換する操作量変換部28が上記補正部の一例である。また、第3の実施形態においては、勾配推定値に基づいて評価量を適応的に変換する評価量変換部29が上記補正部の一例である。
In the first embodiment, the
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。 While several embodiments of the invention have been described, these embodiments have been presented by way of example and are not intended to limit the scope of the invention. These embodiments can be implemented in various other forms, and various omissions, replacements, and modifications can be made without departing from the scope of the invention. These embodiments and their modifications are included in the scope and spirit of the invention, as well as the scope of the invention described in the claims and equivalents thereof.
1,1a,1b…極値制御システム、11…ハイパスフィルタ、12…ディザー信号出力部、13…ローパスフィルタ、14…推定器、9…極値制御システム(基本的な構成)、2,2a,2b…最適制御装置、21…ディザー信号出力部、22…操作量出力部、23…計測情報取得部、24,24b…評価量算出部、25,25a,25b…勾配推定部、26,26a,26b…パラメータ決定部、27…極値制御部、28…操作量変換部、29…評価量変換部、291…推定器、292…変換部、3…水処理プラント、31…嫌気槽、311…薬品投入ポンプ、312…センサー、32…無酸素槽、33…好気槽、331…循環ポンプ、332…ブロワ、34…最終沈澱池、341…返送汚泥ポンプ、342…余剰汚泥引き抜きポンプ、343…センサー
1, 1a, 1b... extremum control system, 11...high pass filter, 12... dither signal output unit, 13... low pass filter, 14... estimator, 9... extremum control system (basic configuration), 2, 2a, 2b... optimum control device, 21... dither signal output unit, 22... operation amount output unit, 23... measurement information acquisition unit, 24, 24b... evaluation amount calculation unit, 25, 25a, 25b... gradient estimation unit, 26, 26a, 26b... parameter determination unit, 27... extreme value control unit, 28... operation amount conversion unit, 29... evaluation amount conversion unit, 291... estimator, 292... conversion unit, 3... water treatment plant, 31... anaerobic tank, 311... Chemical injection pump 312
Claims (10)
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の二階微分値を推定し、
前記補正部は、前記勾配推定部によって推定された前記評価関数の二階微分値に基づいて、前記積分器の積分ゲインを補正する、
最適制御装置。 Based on a manipulated variable of the controlled process and an evaluation quantity indicating an index related to optimization of the controlled process based on the controlled quantity that changes according to the manipulated variable, the operation is performed so that the evaluated quantity approaches an optimum value. A control device that performs extreme value control that changes the amount of
a gradient estimator for estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained by the gradient estimator, in accordance with changes in the evaluation function. Department and
with
The extreme value control unit that executes the extreme value control has an integrator for determining a manipulated variable to be given to the controlled process,
The gradient estimator estimates a second derivative value of the evaluation function as the gradient,
The correcting unit corrects the integral gain of the integrator based on the second order differential value of the evaluation function estimated by the gradient estimating unit.
optimum controller.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の一階微分値を推定し、
前記補正部は、前記極値制御部が前記積分ゲインに基づいて決定した操作量を、前記勾配推定部によって推定された前記評価関数の一階微分値に基づいて補正する、
最適制御装置。 Based on a manipulated variable of the controlled process and an evaluation quantity indicating an index related to optimization of the controlled process based on the controlled quantity that changes according to the manipulated variable, the operation is performed so that the evaluated quantity approaches an optimum value. A control device that performs extreme value control that changes the amount of
a gradient estimator for estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained by the gradient estimator, in accordance with changes in the evaluation function. Department and
with
The extreme value control unit that executes the extreme value control is an integrator for determining the manipulated variable given to the controlled process, and the integral gain thereof is obtained by assuming that the evaluation function is a quadratic function. having an integrator determined based on the second derivative of the evaluation function;
The gradient estimator estimates a first derivative value of the evaluation function as the gradient,
The correcting unit corrects the manipulated variable determined by the extremal value control unit based on the integral gain based on the first derivative of the evaluation function estimated by the gradient estimating unit.
optimum controller.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の一階微分値又は二階微分値を推定し、
前記補正部は、前記勾配推定部によって推定された前記評価関数の一階微分値又は二階微分値に基づいて、前記操作量に対して未知である前記評価関数を、その勾配が前記操作量の変化に対して線形に変化するように変数変換する、
最適制御装置。 Based on a manipulated variable of the controlled process and an evaluation quantity indicating an index related to optimization of the controlled process based on the controlled quantity that changes according to the manipulated variable, the operation is performed so that the evaluated quantity approaches an optimum value. A control device that performs extreme value control that changes the amount of
a gradient estimator for estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained by the gradient estimator, in accordance with changes in the evaluation function. Department and
with
The extreme value control unit that executes the extreme value control is an integrator for determining the manipulated variable given to the controlled process, and the integral gain thereof is obtained by assuming that the evaluation function is a quadratic function. having an integrator determined based on the second derivative of the evaluation function;
The gradient estimating unit estimates a first-order differential value or a second-order differential value of the evaluation function as the gradient,
The correction unit adjusts the evaluation function unknown with respect to the manipulated variable based on the first-order differential value or the second-order differential value of the evaluation function estimated by the gradient estimating unit. Transform variables so that they change linearly with respect to changes,
optimum controller.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記勾配推定部は、前記極値制御に用いられるディザー信号が正弦波である場合に、フィルタ又はオブザーバを用いて前記評価関数の一階以上の微分値を推定する、
最適制御装置。 Based on a manipulated variable of the controlled process and an evaluation quantity indicating an index related to optimization of the controlled process based on the controlled quantity that changes according to the manipulated variable, the operation is performed so that the evaluated quantity approaches an optimum value. A control device that performs extreme value control that changes the amount of
a gradient estimator for estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained by the gradient estimator, in accordance with changes in the evaluation function. Department and
with
When the dither signal used for the extreme value control is a sine wave, the gradient estimating unit estimates a differential value of the first or higher order of the evaluation function using a filter or an observer.
optimum controller.
請求項1から4のいずれか一項に記載の最適制御装置。 Gradient information indicating the gradient of the evaluation function estimated by the gradient estimating unit, and a manipulated variable indicating the manipulated variable determined by the extreme value control unit that executes the extreme value control or the manipulated variable corrected by the correcting unit. Further comprising a display control unit that generates information to be displayed on the display unit in association with the information,
Optimal control device according to any one of claims 1 to 4 .
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、
を有し、
前記勾配推定ステップにおいて、前記勾配として前記評価関数の二階微分値を推定し、
前記補正ステップにおいて、前記極値制御を実行する極値制御部が前記制御対象プロセスに与える操作量を決定するために有している積分器の積分ゲインを、前記勾配推定ステップによって推定された前記評価関数の二階微分値に基づいて補正する、
制御方法。 Based on a manipulated variable of the controlled process and an evaluation quantity indicating an index related to optimization of the controlled process based on the controlled quantity that changes according to the manipulated variable, the operation is performed so that the evaluated quantity approaches an optimum value. A control method for extreme value control that changes the amount of
a gradient estimation step of estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained in the gradient estimation step, in accordance with changes in the evaluation function. a step;
has
estimating a second derivative of the evaluation function as the gradient in the gradient estimation step;
In the correcting step, the integral gain of an integrator that the extreme value control unit that executes the extreme value control has for determining the manipulated variable given to the controlled process is calculated by the gradient estimating step. corrected based on the second derivative of the evaluation function,
control method.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、 a gradient estimation step of estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、 Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained in the gradient estimation step, in accordance with changes in the evaluation function. a step;
を有し、 has
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、 The extreme value control unit that executes the extreme value control is an integrator for determining the manipulated variable given to the controlled process, and the integral gain thereof is obtained by assuming that the evaluation function is a quadratic function. having an integrator determined based on the second derivative of the evaluation function;
前記勾配推定ステップにおいて、前記勾配として前記評価関数の一階微分値を推定し、 estimating a first derivative of the evaluation function as the gradient in the gradient estimation step;
前記補正ステップにおいて、前記極値制御部が前記積分ゲインに基づいて決定した操作量を、前記勾配推定ステップによって推定された前記評価関数の一階微分値に基づいて補正する、 In the correcting step, the manipulated variable determined by the extremal value control unit based on the integral gain is corrected based on the first derivative of the evaluation function estimated by the gradient estimating step.
制御方法。 control method.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、 a gradient estimation step of estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、 Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained in the gradient estimation step, in accordance with changes in the evaluation function. a step;
を有し、 has
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、 The extreme value control unit that executes the extreme value control is an integrator for determining the manipulated variable given to the controlled process, and the integral gain thereof is obtained by assuming that the evaluation function is a quadratic function. having an integrator determined based on the second derivative of the evaluation function;
前記勾配推定ステップにおいて、前記勾配として前記評価関数の一階微分値又は二階微分値を推定し、 in the gradient estimation step, estimating a first-order differential value or a second-order differential value of the evaluation function as the gradient;
前記補正ステップにおいて、前記勾配推定ステップによって推定された前記評価関数の一階微分値又は二階微分値に基づいて、前記操作量に対して未知である前記評価関数を、その勾配が前記操作量の変化に対して線形に変化するように変数変換する、 In the correcting step, the evaluation function, which is unknown with respect to the manipulated variable, is corrected based on the first-order differential value or the second-order differential value of the evaluation function estimated by the gradient estimating step. Transform variables so that they change linearly with respect to changes,
制御方法。 control method.
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、 a gradient estimation step of estimating a gradient indicating a rate of change of an evaluation function, which is a function representing the evaluation quantity and is unknown with respect to the manipulated variable, based on the evaluation quantity observed with respect to the controlled process; ,
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、 Correction for adaptively correcting the control parameter, the manipulated variable, or the evaluation amount necessary for executing the extreme value control based on the estimated value of the gradient obtained in the gradient estimation step, in accordance with changes in the evaluation function. a step;
を有し、 has
前記勾配推定ステップにおいて、前記極値制御に用いられるディザー信号が正弦波である場合に、フィルタ又はオブザーバを用いて前記評価関数の一階以上の微分値を推定する、 In the gradient estimation step, if the dither signal used for the extreme value control is a sine wave, a filter or an observer is used to estimate a differential value of the first order or higher of the evaluation function.
制御方法。 control method.
請求項1から5のいずれか一項に記載の最適制御装置として機能させるためのコンピュータプログラム。 the computer,
A computer program for functioning as the optimum control device according to any one of claims 1 to 5 .
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018033243A JP7154774B2 (en) | 2018-02-27 | 2018-02-27 | Optimal control device, control method and computer program |
CN201980015659.5A CN111788529A (en) | 2018-02-27 | 2019-02-27 | Optimal control device, control method, and computer program |
PCT/JP2019/007466 WO2019167998A1 (en) | 2018-02-27 | 2019-02-27 | Optimum control device, control method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018033243A JP7154774B2 (en) | 2018-02-27 | 2018-02-27 | Optimal control device, control method and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019148988A JP2019148988A (en) | 2019-09-05 |
JP7154774B2 true JP7154774B2 (en) | 2022-10-18 |
Family
ID=67805497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018033243A Active JP7154774B2 (en) | 2018-02-27 | 2018-02-27 | Optimal control device, control method and computer program |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7154774B2 (en) |
CN (1) | CN111788529A (en) |
WO (1) | WO2019167998A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022028390A (en) * | 2020-08-03 | 2022-02-16 | 株式会社東芝 | Optimum value search controller, method for controlling search of optimum value, computer program, and optimum value search control system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017033104A (en) | 2015-07-29 | 2017-02-09 | 株式会社東芝 | Optimum control device, optimal control method, computer program and optimal control system |
JP2017224176A (en) | 2016-06-15 | 2017-12-21 | 株式会社東芝 | Controller, control method, and computer program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09325801A (en) * | 1996-06-06 | 1997-12-16 | Nitto Kogyo Kk | Extreme value control circuit |
-
2018
- 2018-02-27 JP JP2018033243A patent/JP7154774B2/en active Active
-
2019
- 2019-02-27 WO PCT/JP2019/007466 patent/WO2019167998A1/en active Application Filing
- 2019-02-27 CN CN201980015659.5A patent/CN111788529A/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017033104A (en) | 2015-07-29 | 2017-02-09 | 株式会社東芝 | Optimum control device, optimal control method, computer program and optimal control system |
JP2017224176A (en) | 2016-06-15 | 2017-12-21 | 株式会社東芝 | Controller, control method, and computer program |
Also Published As
Publication number | Publication date |
---|---|
JP2019148988A (en) | 2019-09-05 |
WO2019167998A1 (en) | 2019-09-06 |
CN111788529A (en) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107924162B (en) | Optimal control device, optimal control method, recording medium, and optimal control system | |
Sanz-Serna | Modulated Fourier expansions and heterogeneous multiscale methods | |
JP7183411B2 (en) | Optimal control device, optimal control method and computer program | |
JP7154774B2 (en) | Optimal control device, control method and computer program | |
CN109067232B (en) | Grid-connected inverter current control method based on recurrent neural network | |
CN110907702A (en) | Improved dynamic harmonic estimation method and system | |
Roy et al. | Level control of two tank system by fractional order integral state feedback controller tuned by PSO with experimental validation | |
JP6655975B2 (en) | Aeration control device and aeration control method | |
Mazenc et al. | Strict Lyapunov function constructions under LaSalle conditions with an application to Lotka-Volterra systems | |
CN110646518A (en) | Output control method of ultrasonic transducer and related equipment | |
JP6744145B2 (en) | Control device, control method, and computer program | |
JP6290115B2 (en) | Control system, control device, control method, and computer program | |
CN112400142B (en) | Control device, control method, and computer storage medium | |
JP2014135851A (en) | Resonant frequency search device, resonant frequency search method and program | |
Radtke et al. | A positive and multi-element conserving time stepping scheme for biogeochemical processes in marine ecosystem models | |
JP3460211B2 (en) | Sewage treatment control device | |
Stîngă et al. | Estimation based control strategies for an aerobic bioprocess | |
Vahofoqulovich | Algorithms and Circuitry Methods for Increasing the Noise Immunity of Analog Blocks of Informationmeasuring Systems | |
Krčmar et al. | Performance analysis of the speed servomechanism with the adaptive PI controller | |
CN109390933B (en) | Orthogonal signal generation method based on sliding-mode observer and orthogonal signal generator | |
SU1629873A1 (en) | Method for harmonic distortion factor measurement | |
JP2024017830A (en) | Optimal control device, optimal control method and computer program | |
CN114152299A (en) | Ultrasonic gas meter, flow stabilizing and filtering method and system for flow meter | |
Burkatovskaya et al. | Truncated parameter estimation of AR (1) process with additive noise | |
Santos et al. | Global Stabilization for Nonminimum Phase Systems by means of Sliding Mode Control and Multiple Observers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221005 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7154774 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |