JP5977207B2 - 状態推定装置、該方法及び該プログラム - Google Patents

状態推定装置、該方法及び該プログラム Download PDF

Info

Publication number
JP5977207B2
JP5977207B2 JP2013140684A JP2013140684A JP5977207B2 JP 5977207 B2 JP5977207 B2 JP 5977207B2 JP 2013140684 A JP2013140684 A JP 2013140684A JP 2013140684 A JP2013140684 A JP 2013140684A JP 5977207 B2 JP5977207 B2 JP 5977207B2
Authority
JP
Japan
Prior art keywords
state
value
matrix
time
state estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013140684A
Other languages
English (en)
Other versions
JP2015014873A (ja
Inventor
西田 吉晴
吉晴 西田
健治 藤本
健治 藤本
敏章 渡邉
敏章 渡邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kobe Steel Ltd
Original Assignee
Kobe Steel Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kobe Steel Ltd filed Critical Kobe Steel Ltd
Priority to JP2013140684A priority Critical patent/JP5977207B2/ja
Publication of JP2015014873A publication Critical patent/JP2015014873A/ja
Application granted granted Critical
Publication of JP5977207B2 publication Critical patent/JP5977207B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • General Factory Administration (AREA)
  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、状態方程式を用いた状態推定方法に関する。
現実のシステムを制御する際には、様々な要因によってその制御量が目標値からばらついてしまうことがある。そのため、そのようなバラツキを抑えるための高精度な制御の実現が必要とされている。
例えば、大規模生産を行う鉄鋼プラントでは、連続鋳造機や転炉、圧延機、鋼板冷却設備、焼鈍炉など、その殆どがバッチプロセスである。連続化されている連続圧延機や連続焼鈍炉でも、板毎に見るとバッチプロセスと見ることができる。このようなバッチ毎の確率変動や製品毎の確率変動の存在下において、高品質な鋼板を安定して生産するが強く要求されている。しかし、種々の要因により製品にばらつきが生じてしまうことがある。これは、現実のシステムでは内部状態を直接観測できない場合があるためである。このため、システムの内部状態を推定することができれば、製品のばらつきを抑制できることが可能となる。
確率システムに対する代表的な状態推定手法として、線形システムにおいて誤差の二乗平均を最小にするように推定量を求めるカルマンフィルタ(非特許文献1)がある。また、非線形確率システムに関する状態推定法として、状態の非線形関数の推定値近傍での線形近似に基づく拡張カルマンフィルタや、期待値計算にモンテカルロ法を用いたパーティクルフィルタが知られている。
更に、確率変数をパラメータに持つ系に対する状態推定問題はDe Koningにより考えられている(非特許文献2)。この手法は確率変数パラメータの影響を考慮したうえでカルマンフィルタの問題設定に帰着させるものとなっており、パラメータが確定値であることを前提としている通常のカルマンフィルタでは解くことができない問題に有効である。
R.E.Kalman.A new approach to linear filtering and prediction problems. Journal of Basic Engineering,Vol.82,pp.35−45,1960. W.L.De Koning. Optimal estimation of linear discrete−time systems with stochastic parameters. Au−tomatica,Vol.20,No.1,pp.113−115,1984.
しかし、このDe Koningによる手法では、システムパラメータは毎時刻確率的に変化する値とし扱われ、現実のシステムとは異なる場合がある。つまり、現実のシステムにおいてパラメータは緩やかな時間変化もしくは製造製品ごとに変わる場合が多いと考えられる。
そこで、本発明は、システムパラメータを時間に依存しない確率変数として扱う状態推定法を用いて状態を推定する状態推定装置、状態推定方法及び状態推定プログラムを提供することを目的とする。
上述の目的を達成するために、本発明に係る状態推定装置は、バッチプロセスから観測情報を取得する取得部と、前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算部とを備え、前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いることを特徴とする。
そして、本発明に係る状態推定方法は、観測情報から、所望の時刻の状態値を推定する状態推定装置で用いられる状態推定方法であって、バッチプロセスから前記観測情報を取得する取得ステップと、前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算ステップとを備え、前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いることを特徴とする。
また、本発明に係る、コンピュータに実行させるための状態推定プログラムは、観測情報から、所望の時刻の状態値を推定する状態推定装置で用いられる状態推定プログラムであって、バッチプロセスから前記観測情報を取得する取得手段と、前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算手段としてコンピュータを機能させ、前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いることを特徴とする。
また、上述の状態推定装置において、前記状態演算部は、wハットをシステムノイズの推定値、uを観測情報、E[ ]を期待値演算子、Nを過去の状態値の数とするとき、以下の状態方程式により、時刻kの時の状態値xハットを算出することが好ましい。
Figure 0005977207
このような構成の状態推定装置、状態推定方法及び状態推定プログラムによれば、状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上を、或る確率分布に従ってばらつくものとして扱い、その期待値を用いて状態値を推定するので、より確からしい状態値を推定することが可能となる。尚、Aを含む項とは、nステップ過去の状態値が、現在の状態値に与える影響を表す係数行列である。
また、上述の状態推定装置において、前記確率分布は、状態値を推定する製品に応じて設定されることが好ましい。
この構成によれば、製品ごとに適した状態推定方程式を用いて状態値を推定することが可能となる。
このような構成の状態推定装置、状態推定方法及び状態推定プログラムでは、システムパラメータを時間に依存しない確率変数として扱う状態推定法を用いて状態を推定することができる。
状態推定装置の構成を示すブロック図である。 図1の状態推定装置の状態推定処理のフローチャートである。 板の内部温度の変化を示す図である。 遷移領域での熱伝導率の確率分布を示す図である。 図5(a)は、確率変数aが従う一様分布の確率密度関数を示す図であり、図5(b)は、確率変数b、cが従う一様分布の確率密度関数を示す図である。 100サンプルの確率変数aの値を示す図である。 100サンプルの確率変数aに対して行列Aの固有値の大きさを示す図である。 カルマンフィルタを用いた場合に誤差ノルムの値を示す図である。 実施形態の推定方法を用いた場合の誤差ノルムの値を示す図であり、図9(a)は、設計パラメータN=0のときの誤差ノルムを示し、図9(b)は、設計パラメータN=1のときの誤差ノルムを示し、図9(c)は、設計パラメータN=2のときの誤差ノルムを示し、図9(d)は、設計パラメータN=3のときの誤差ノルムを示す図である。 サンプルの平均値及び標準偏差の表を示す図である。 実施形態の方法を用いた場合の誤差ノルムの平均値の遷移を示す図である。 取り鍋の保温能力の確率分布を示す図である。 圧延材の塑性係数の確率分布を示す図である。
<実施形態1>
以下、本発明に係る実施形態を図面に基づいて説明する。
<構成>
図1は、状態推定装置の構成を示すブロック図である。図1において、状態推定装置1は、演算処理部11、入力部12、出力部13、内部記憶部14、補助記憶部16及びバス18を備えて構成される。
演算処理部11は、例えば、マイクロプロセッサ等を備えて構成され、機能的に、制御部111、初期設定部112、前時刻推定値算出部113、及び、最適推定値算出部114を備える。
制御部111は、初期設定部112、前時刻推定値算出部113、及び、最適推定値算出部114を制御して状態推定の演算を行い、また、制御プログラムに従い入力部12、出力部13、内部記憶部14及び補助記憶部16を制御する。
初期設定部112は、状態推定処理を行う際の初期値を設定する機能を有する。
前時刻推定値算出部113は、推定しようとする時刻よりも前の時刻の状態の推定値及びシステムノイズの推定値を算出する機能を有する。
最適推定値算出部114は、前時刻推定値算出部113が算出した推定値を用いて最適推定値を算出する。これらの詳細については、<動作>の項で説明する。
入力部12は、本状態推定装置1の演算開始指示等の各種コマンドやシステムパラメータ等の各種データを状態推定装置1に入力する機器であり、例えば、キーボードやマウス等である。出力部13は、入力部12から入力されたコマンド及びデータや本状態推定装置1の演算結果等を出力する機器であり、例えばCRT(Cathode Ray Tube)ディスプレイ、LCD(Liquid Crystal Display)、有機EL(Electro Luminesence)ディスプレイ又はプラズマディスプレイ等の表示装置やプリンタ等の印字装置等である。
内部記憶部14は、演算処理部11が実行する状態推定プログラムや制御プログラムを補助記憶部16から読み込むと共に、状態推定プログラム実行中の各データを一時的に記憶する所謂ワーキングメモリであり、例えば揮発性の記憶素子であるRAM(Random Access Memory)を備えて構成される。
補助記憶部16は、例えばROM(Read Only Memory)及びEEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性の記憶素子やハードディスク等のデータやプログラムを記憶する装置であり、測定値記憶部161、状態空間モデル記憶部162、及び、推定値記憶部163を備える他、状態推定プログラムや状態推定装置1を動作させるための制御プログラム等の各プログラム(不図示)、及び、各プログラムの実行に必要なデータ(不図示)等を記憶する。
測定値記憶部161は、観測データ等の推定値の演算に必要なデータ、例えば、厚板の冷却工程における厚板の表面温度等を記憶する。
状態空間モデル記憶部162は、推定対象の状態空間モデル、例えば、厚板の冷却工程における内部温度を推定する厚板冷却モデルを記憶する機能を有する。
推定値記憶部163は、最適推定値算出部114が算出した時刻毎の推定値や、前時刻推定値算出部113が算出した前時刻の状態の推定値、システムノイズの推定値等を必要に応じて記憶しておく機能を有する。
これら演算処理部11、入力部12、出力部13、内部記憶部14及び補助記憶部16は、データを相互に交換することができるようにバス18にそれぞれ接続される。
なお、必要に応じて分子軌道演算装置1は、図1に破線で示す外部記憶部15や通信インターフェース部(不図示)をさらに備えてもよい。
外部記憶部15は、例えば、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、CD−R(Compact Disc Recordable)及びDVD−R(Digital Versatile Disc Recordable)等の記録媒体との間でデータを読み込み及び/又は書き込みを行う装置であり、例えば、フレキシブルディスクドライブ、CD−ROMドライブ、CD−Rドライブ及びDVD−Rドライブ等である。通信インターフェース部は、通信網に接続され、通信網を介して他のクライアント装置との間で通信信号を送受信するための機器である。
各プログラムが格納されていない場合には、これらを記録した記録媒体から外部記憶部15を介して補助記憶部16にインストールされるように構成してもよく、また、これらプログラムを管理するサーバコンピュータ(不図示)から通信網及び通信インターフェース部を介して各プログラムがダウンロードされるように構成してもよい。また、状態推定の演算に当たって状態推定装置1に入力すべきデータは、このデータを記憶した記録媒体によって外部記憶部15を介して状態推定装置1に入力されるように構成してもよく、また、クライアント装置から通信網及び通信インターフェース部を介して状態推定装置1に入力されるように構成してもよい。
次に、本実施形態の状態推定方法について説明する。尚、以下、式中で英文字記号(変数)に^(ハット)を付すものは、「(英文字記号)ハット」と記載し、英文文字に ̄(オーバーライン)を付すものは、「(英文字記号)オーバーライン」と記載するものとする。
<状態推定方法>
現実のシステムにおいては、システムパラメータ(A,B,Cの要素)が或るばらつきをもって変化(確率変動)することを考慮し、実施形態の状態推定方法は、その影響が最も顕著に現れる期待値E[A]を用いる。
まず、既存の状態推定方法であるカルマンフィルタを考える。通常のカルマンフィルタは、以下の離散時間線形システムを対象とする。
k+1=Ax+Bu+w ・・・(K1)
=Cx+v ・・・(K2)
p(w)=N(w|0,Q) ・・・(K3)
p(v)=N(v|0,R) ・・・(K4)
ここで、x∈Rが状態、u∈Rが制御入力、y∈Rが出力、w∈Rがシステムノイズ、v∈Rが観測ノイズである。A、B、Cは、それぞれn×n、n×m、p×nの大きさをもつ行列であり、Aを状態行列、Bを入力行列、Cを出力行列という。Rは、n次元ユークリッド空間を表す。
p(a)は、aの確率密度関数(確率密度)を表し、p(a)=N(a|μ,Σ)は、確率変数aがガウス分布に従うことを示す。μは平均を示し、Σは共分散行列を示す。従って、式(K3)は、wの確率分布p(w)が、平均0、分散Qの正規分布に従うことを示し、式(K4)は、vの確率分布p(v)が、平均0、分散Rの正規分布に従うことを示す。
xハットは状態xの推定値であり、kは自然数であって時刻を示すものとする。時刻kでの状態の最適推定値をxハットとし、時刻kよりも1時点前での出力観測後の推定値の平均値をxk|k−1ハットとし、共分散をΠk|k−1とすると、内部状態ベクトルxの推定値xk|kハットは、以下の式(K5)、(K6)、(K7)、(K8)を繰り返し計算することで求められる。
Figure 0005977207
尚、(A)は、行列A又はベクトルAの転置を表す作用素とし、(A)−1は、行列Aの逆行列を表す作用素とする。
このように、カルマンフィルタなどの従来の状態推定手法では、観測ノイズvやシステム外乱wなどの加法的な外乱が確率的な変動をするものとして取り扱うことができる。しかし、実際のシステムでは、外乱のみが確率的な変動をするのではなく、パラメータそのものもあるばらつきを持っている。
最も代表的なカルマンフィルタではvやwが正規分布に従い、その分散が分かっていれば、もっともらしい推定値を与えることが示されているが、A、B、C行列の要素(システムパラメータ)が確率的に変動する場合は扱うことができない(推定することができるが、その推定値が確からしいかどうかは、保証されない)。
そこで、実施形態では、以下のように、A、B、C行列の要素(システムパラメータ)を、確率的な変動を有する確率変数として取り扱う。
実施形態の状態推定は、以下の離散時間線形システムを対象とする。
Figure 0005977207
Figure 0005977207
通常のカルマンフィルタが対象とするシステムと異なる点は、A(ω)∈Rn×n、B(ω)∈Rn×m、C(ω)∈Rp×nが確率変数である点である。尚、ωは偶発性を表す変数である。A(ω)、B(ω)、C(ω)、とw、vは独立であると仮定する。
そして、以下の式(3)ように条件付き確率密度関数が最大となるときを最適推定値と考えるものとする。時刻kでの状態の最適推定値をxハットとし、考慮する過去の推定値の数をNとする。arg max f(a,b,c,…)は、関数f(a,b,c,…)が最大値をとるときのパラメータa,b,c,…を示している。例えばarg max p(x|y)は、出力yの出力制約付き確率密度関数p(x|y)が最大値をとるときの状態xを示している。
Figure 0005977207
式(1)、及び、式(2)より、システムのマルコフ性から状態xの同時確率密度関数は、式(4)となり、出力yの条件付き確率密度関数は、式(5)となる。
Figure 0005977207
Figure 0005977207
式(4)、及び、式(2)より、ベイズの定理を用いると式(3)式の確率密度関数は、式(6)とできる。
Figure 0005977207
この関数は、対数を考えても最大値は変わらないため、最適推定値は、式(7)のように表せる。
Figure 0005977207
ここで、状態xk−Nは、平均xk−1オーバーラインで分散Πk−Nの正規分布に従い、ノイズw、vは、平均0で分散がそれぞれQ、Rの正規分布に従うと仮定すると、最適推定値xハットを求める際の評価関数は、次式(8)で表される。
Figure 0005977207
従って、式(3)の最適推定値xハットは、式(9)式で求められることになる。arg min f(a,b,c,…)は、関数f(a,b,c,…)が最小値をとるときのパラメータa,b,c,…を示している。例えばarg min E[J(x;u)]は、入力uが入力時の評価関数J(x;u)の期待値が最小値をとるときの状態xを示している。
Figure 0005977207
期待値E[x]は、xの期待値演算を表し、具体的には、E[x]=∫xp(x)dxである。式(9)中の期待値演算E[a]は、ωに関する期待値を表しており、ここでは確率変数A、B、Cの統計量を用いて計算を行う。
式(1)及び式(2)で表すシステムに対して、式(10)で示す二次形式評価関数を考える。
Figure 0005977207
そして、この評価関数を最小にする最適推定値xハット(k=N、N+1・・・)は、式(11)で得ることができる。
Figure 0005977207
ここで、N個前の推定値xk−Nハットは、以下の式(12)で求める。この式(12)中の実測値の平均値xk−Nオーバーラインは式(13)で求め、分散Πk−Nを式(14)で求める。
Figure 0005977207
Figure 0005977207
Figure 0005977207
また、式(11)中のシステムノイズの推定値wk−qハットは、以下の式(15)で求める。
Figure 0005977207
但し、Yk:q、O、Rは、それぞれ以下の式(16)、式(17)、式(18)で表される。尚、式(18)は、対角成分のみを表し、他の成分はすべて0である。
Figure 0005977207
Figure 0005977207
Figure 0005977207
ここで、B行列が確率変数ではない場合、すなわち、確定的である場合には、上述の式(11)に代えて、以下の式(19)としてもよい。すなわち、n≧1のAの期待値E[A]を係数行列として算出し、各ベクトルxk−Nハット、B・u、wハットに乗じることで現在の状態推定値xハットを推定することができる。
Figure 0005977207
<状態推定モデルの例>
ここでは、鋼鉄プラントにおいて熱間圧延により厚鋼板を製造する際の冷却工程(バッチプロセスの1例)で、板の表面温度から板内部の温度を推定する場合を例に説明する。
厚板の冷却工程においては、板内部の温度にて管理・制御することが重要であり、内部温度は表面温度とは大きく異なっている。従って、内部温度をより正確に推定する必要がある。
そこで、熱伝達率αなどを確率変数として扱い、板の厚み方向の熱伝導を考慮した状態方程式にて定式化し、Aの期待値E[A]を考慮したうえで状態推定することで、板の内部温度の変化を精度良く推定する。
図3に、板の内部温度の変化を示すグラフを示す。横軸は時間を表し、縦軸は内部温度を表す。このグラフは、板を厚み方向に15に等分割し、表面温度と、等分割されたそれぞれ厚み位置における板の内部温度の変化を示している。板の内部の温度分布は、板の中央を中心に対称となっているため、板中央以外の温度変化のグラフは2本ずつ重なっている。従って、全部で9本のグラフとして見えている。また、図4は、遷移領域での熱伝達率の確立分布を示すグラフである。図4のグラフは、横軸が熱伝達率を表し、縦軸が確率を表す。遷移領域とは、膜沸騰から核沸騰に遷移する温度範囲をいい、この例では500℃前後で遷移している。熱伝達率αは、膜沸騰と核沸騰で値が大きく異なる。高温では膜沸騰、低温では核沸騰となり、膜沸騰から核沸騰に遷移する温度域500℃前後では、核沸騰への遷移が始まると一気に核沸騰に移行するため、熱伝達率は、図4のグラフのように、ふたこぶの確率分布を示すことになる。
熱伝達率及び熱伝導率を確率変数として扱った場合、厚板冷却モデルは、以下のように導出される。
物体内の熱伝導と境界で熱伝達は、以下の式(20)、式(21)で表される。
Figure 0005977207
Figure 0005977207
ここで、Tδは表面温度、Tは冷媒温度であり、αは熱伝達率を表す。また、kは熱拡散率を表す。
熱拡散率kは、k=λ/ρcであり、λは熱伝導率を表し、ρは密度を表し、cは比熱を表す。これは、一般的に温度の関数となるが、温度の変動範囲が小さい場合には定数として扱うことができる。この時、式(21)は、以下の式(22)とできる。
Figure 0005977207
ここで、式(21)、式(22)を差分近似して代数方程式を作る。板厚をN等分して、表面温度をT、TN−1、板内部の温度をT(1≦i≦N−2)とすると、j+1時刻の各点の温度は、j時刻の温度を用いて、式(23)、式(24)、式(25)のように書ける。
Figure 0005977207
Figure 0005977207
Figure 0005977207
ここでは、γ=kΔt/(Δx)2として、時不変の定数として扱う。そして、λ及びαは、時変とする。
上述の式(23)、式(24)、式(25)をまとめると、以下の式(26)となる。
Figure 0005977207
ここで、表面温度は観測できる値であるので、以下の式(27)のように表せる。
Figure 0005977207
以上より、厚板冷却状態空間モデルは、以下の式(28)、式(29)で表せる。
Figure 0005977207
Figure 0005977207
が、内部温度の推定値であり、uが、冷媒温度であり、yが、表面温度であり、A、B、Cが、システムパラメータである。以下に、x、u、y、A、B、Cを示す。
Figure 0005977207
<動作>
次に、本実施形態の動作について説明する。ここでは、上述の厚板冷却状態空間モデルを用いて、厚板の内部温度を推定する場合を説明する。
図2は、状態推定装置1の状態推定処理のフローチャートである。
状態推定処理を開始する前に、厚板冷却状態空間モデルは、状態空間モデル記憶部162に記憶され、厚板の表面温度等の推定処理に必要なデータは測定値記憶部161に記憶されているものとする。
また、推定値記憶部163には、今までに推定した推定値が記憶されているものとする。少なくとも、時刻kの最適推定値を求める場合には、時刻k−N−1までの推定値及び分散値が記憶されているものとする。例えば、N(設計パラメータ)が5の場合は、時刻kから6個前の時刻までの推定値が記憶されているものとする。状態推定装置1の状態推定処理では、或る時刻の推定値を算出する際に、1つ前の推定値を用いる。つまり、時刻k−6の推定値を用いて、時刻k−5の推定値を算出し、時刻k−5の推定値を用いて、時刻k−4の推定値を算出することを繰り返して、時刻kの推定値を算出する。従って、Nは、対象となる状態空間モデルにおいて最適な推定値が求まるまでさかのぼる回数を設定する。尚、最初の推定値を算出する場合は、1つ前の推定値が存在しないため、経験則等から決定した値を推定値として用いる。
フローチャートでは、kに1を加算することで、必要な回数の繰り返しが実現される。
まず、ユーザは、入力部12を用いて、状態推定処理の開始を指示するコマンド等を入力する。
入力部12を介して、推定処理の開始を指示するコマンドが入力されたことを検知した11の制御部111は、初期設定部112に初期値の取得を依頼する。依頼を受けた初期設定部112は、出力部13に初期値の入力を要求するメッセージを表示し、入力部12を介して、ユーザから設計パラメータNを取得すると、推定値記憶部163から状態初期値xk−N−1ハット、分散初期値Πk−N−1を読み出す。初期設定部112は、読み出した値及びシステムパラメータNを、作業メモリに記憶する(ステップS10)。
次に、制御部111は、前時刻推定値算出部113に前時間の推定値の算出を依頼する。依頼を受けた前時刻推定値算出部113は、補助記憶部16の状態空間モデル記憶部162に記憶されている空間モデルを参照し、また、必要に応じて測定値記憶部161及び作業メモリからデータを読み出し、上述の式(13)を用いて、状態の平均値xk−Nオーバーラインを算出する。また、前時刻推定値算出部113は、上述の式(14)を用いて、分散Πk−Nを算出する(ステップS11)。
次に、前時刻推定値算出部113は、算出した状態の平均値xk−Nオーバーライン、及び、分散Πk−Nを用いて、上述の式(12)から、N個前の状態推定値xk−Nハットを算出し、更に、式(15)を用いて、k−Nからk−1までそれぞれの外乱推定値wk−Nハット、・・・、wk−1ハットを算出する(ステップS12)。尚、厚板冷却状態空間モデルでは、上述の式(28)に示すように、システムノイズ(外乱)は用いないことから、外乱推定値は算出しない。
前時刻推定値算出部113が推定値を算出すると、次に、制御部111は、最適推定値算出部114に最適推定値の算出を依頼する。依頼を受けた最適推定値算出部114は、前時刻推定値算出部113が算出した状態推定値xk−Nハット、及び、外乱推定値wk−Nハット、・・・、wk−1ハットと、測定値記憶部161から読出したk−Nからk−1までそれぞれの制御入力uk−N、・・・、uk−1を用いて、上述の式(11)から、最適推定値xハットを算出する(ステップS13)。
制御部111は、kに1を加算し、ステップS11からの処理を繰り返す(ステップS15:No)。すなわち、kに1を加算する毎に、終端時刻(推定値を求めたい時刻)からN−k個前の状態推定値を求めることになる。言い換えれば、N個前から、N−1個前、N−2個というように、順番に終端時刻に近い時刻の推定値を求めていく。
kが終端時刻(kの初期値が0の場合は、k=N)となったら(ステップS15:Yes)、制御部111は、直近に最適推定値算出部114が算出した最適推定値xハットを、出力部13に表示し(ステップS16)、処理を終了する。
<実施形態2>
実施形態1では、確率変数を正規分布にて与えていたが、実施形態2では、一様分布にて与える場合を説明する。カルマンフィルタは正規分布しか扱えなかったが、実施形態の手法では、正規分布に限らず、種々の確率分布を扱うことが可能である。
ここでは、以下の式(31)、式(32)、式(33)で示すパラメータを持つ、上述の式(1)、式(2)で表される線形システムを考える。
Figure 0005977207
Figure 0005977207
Figure 0005977207
確率変数a、b、cは、以下のような一様分布に従うとする。U(z|a,b)は、zがa〜bの範囲で一定値であり、zがa未満又はyを超えると0であることを表す。
p(a)=U(a|−0.5,0.5)
p(b)=U(b|−3,3)
p(c)=U(c|−3,3)
確率変数aが従う一様分布の確率密度関数を、図5(a)に示し、確率変数b、cが従う一様分布の確率密度関数を、図5(b)に示す。
図5(a)、(b)の確率分布に従って、確率変数a、b、cのサンプルを100通り作成する。そのときの100サンプルでの確率変数aの値を、図6に示す。横軸はサンプルの番号を表し、縦軸は確率変数aの値を示す。図中の破線は、全サンプルの平均値を表す。また、この100サンプルのaに対して、上述の式(31)で示す行列Aの固有値の大きさを、図7に示す。式(31)の行列Aは2行×2列の行列となっており、2行×2列の行列の固有値は2つ存在する。この2つの固有値双方を最大固有値(実線のグラフ)と最小固有値(破線のグラフ)として図7で図示してる。この図7から、全サンプルにおいて、固有値が1より小さくなっているので、上述の線形システムは安定システムであることが分かる。
また、各サンプルに対して、50ステップの状態推定(x,x,x,…,x50,の50ステップの状態推定)を行った。以下の式(34)を用いて、100サンプルについて算出した誤差ノルムの値を計算した結果を、図8、図9に示す。図8、図9の各グラフにおいて、横軸が、サンプルの番号を表し、縦軸が、誤差ノルムを表す。
Figure 0005977207
図8は、カルマンフィルタを用いて推定した場合の誤差ノルムの値であり、図9は、実施形態の方法を用いて推定した場合の誤差ノルムの値である。図9(a)は、設計パラメータN=0のときの誤差ノルムを示し、図9(b)は、設計パラメータN=1のときの誤差ノルムを示し、図9(c)は、設計パラメータN=2のときの誤差ノルムを示し、図9(d)は、設計パラメータN=3のときの誤差ノルムを示す。尚、推定の初期値はxハット=(0,0)としている。また、図8、図9において、実線が各サンプルでの誤差ノルムの値を示す。太線の破線が前サンプルの平均値を示し、細線の破線が、平均値に標準偏差を加減算した値を示す。
図8、図9に示すサンプルの平均値及び標準偏差の具体的な数値を図10に示す。図10の表において、「Kalman Filter」は、カルマンフィルタを用いた場合の平均値と標準偏差を示し、「Proposed Method」は、実施形態の方法を用いた場合の、Nの値ごとの平均値と標準偏差を示す。また、「deifference」は、実施形態の方法を用いた場合の、カルマンフィルタと比較した平均値の減少率を示す。
図11は、実施形態の方法を用いた場合の誤差ノルムの平均値の遷移を示す。横軸が、設計パラメータNの値を表し、縦軸が、誤差ノルムの平均値を表す。設計パラメータNの値が大きくなる程、誤差ノルムの平均値が小さくなることが分かる。
図5〜図11に示すように、確率変数がガウス分布に従う場合と同様に、実施形態の方法では、平均するとカルマンフィルタよりも誤差が小さくなっており、設計パラメータNの値を大きくすることで、実施形態の方法の性能が向上することが分かる。また、図10の表より、確率変数がガウス分布に従う場合に比べて、実施形態の方法とカルマンフィルタとの違いが、設計パラメータNの値を大きくなるにつれて大きくなっていることが分かる。
<実施形態3>
実施形態1では、鋼鉄プラントにおいて熱間圧延により厚鋼板を製造する際の冷却工程で、板の表面温度から板内部の温度を推定する場合を例に説明した。その際、熱伝達率αを確率変数として扱うことして、図4に、遷移領域での熱伝達率の確率分布を示すグラフを示した。
熱伝達率αを確率変数として扱う以外に、厚鋼板の原料となる溶鋼を保温する取り鍋の保温能力を確率変数として扱うこととしてもよい。図12に、取り鍋の保温能力の確率分布を示す。図12のグラフは、横軸が熱伝達率を表し、縦軸が確率を表す。取り鍋の保温能力は、図12に示すように正規分布ではなく、偏りを持った分布を示す。
また、圧延材の塑性係数を確率変数として扱うこととしてもよい。図13に、圧延材の塑性係数の確率分布を示す。図13のグラフは、横軸が塑性係数を表し、縦軸が確率を表す。圧延材は、温度低下とともに硬くなる。そして、加熱炉から出されて圧延機まで搬送される最短時間は設備能力などで決定されるが、待ち時間等の様々な流動的な要件により、加熱炉から圧延機で処理されるまでの時間は、延長されることになる。従って、圧延材の塑性係数は、図13に示すように、温度低下(硬い)方向に延びたような確率分布で示されることが多くなる。
1 状態推定装置
11 演算処理部
12 入力部
13 出力部
16 補助記憶部
111 制御部
112 初期設定部
113 前時刻推定値算出部
114 最適推定値算出部
161 測定値記憶部
162 状態空間モデル記憶部
163 推定値記憶部

Claims (5)

  1. バッチプロセスから観測情報を取得する取得部と、
    前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算部とを備え、
    前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いる
    ことを特徴とする状態推定装置。
  2. 前記状態演算部は、wハットをシステムノイズの推定値、uを観測情報、E[ ]を期待値演算子、Nを過去の状態値の数とするとき、以下の状態方程式により、時刻kの時の状態値xハットを算出すること
    Figure 0005977207
    を特徴とする請求項1に記載の状態推定装置。
  3. 前記確率分布は、状態値を推定する製品に応じて設定されること
    を特徴とする請求項1に記載の状態推定装置。
  4. 観測情報から、所望の時刻の状態値を推定する状態推定装置で用いられる状態推定方法であって、
    バッチプロセスから前記観測情報を取得する取得ステップと、
    前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算ステップとを備え、
    前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いる
    ことを特徴とする状態推定方法。
  5. 観測情報から、所望の時刻の状態値を推定する状態推定装置で用いられる状態推定プログラムであって、
    バッチプロセスから前記観測情報を取得する取得手段と、
    前記観測情報から、状態方程式を用いて、前記バッチプロセスにおける所望の時刻の状態値を推定する状態演算手段としてコンピュータを機能させ、
    前記状態方程式の状態行列A、入力行列B及び出力行列Cのうちの少なくとも1つ以上が、時間変数に無関係な或る確率分布に従ってばらつくものであり、状態行列A(n≧1:nは整数)の期待値を、過去の時刻の状態値の係数行列として用い、あるいは、Aを含む項の期待値として用いる
    ことを特徴とする状態推定プログラム。
JP2013140684A 2013-07-04 2013-07-04 状態推定装置、該方法及び該プログラム Active JP5977207B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013140684A JP5977207B2 (ja) 2013-07-04 2013-07-04 状態推定装置、該方法及び該プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013140684A JP5977207B2 (ja) 2013-07-04 2013-07-04 状態推定装置、該方法及び該プログラム

Publications (2)

Publication Number Publication Date
JP2015014873A JP2015014873A (ja) 2015-01-22
JP5977207B2 true JP5977207B2 (ja) 2016-08-24

Family

ID=52436577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013140684A Active JP5977207B2 (ja) 2013-07-04 2013-07-04 状態推定装置、該方法及び該プログラム

Country Status (1)

Country Link
JP (1) JP5977207B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114127643B (zh) * 2019-07-19 2024-03-29 三菱电机株式会社 参数同定装置、参数同定方法及存储介质
KR102478451B1 (ko) * 2021-05-04 2022-12-19 국방과학연구소 연산 장치 및 이를 이용한 시스템의 상태 추정 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001091369A (ja) * 1999-09-21 2001-04-06 Babcock Hitachi Kk ガス温度計測装置
JP4246900B2 (ja) * 2000-08-31 2009-04-02 株式会社東芝 プラント機器の運用診断装置及びその運用診断方法
US6738682B1 (en) * 2001-09-13 2004-05-18 Advances Micro Devices, Inc. Method and apparatus for scheduling based on state estimation uncertainties
JP5012660B2 (ja) * 2008-05-22 2012-08-29 住友金属工業株式会社 製品品質予測および制御方法
JP5238048B2 (ja) * 2011-02-15 2013-07-17 日本電信電話株式会社 アプリケーション接続数ピーク値推定装置及び方法及びプログラム

Also Published As

Publication number Publication date
JP2015014873A (ja) 2015-01-22

Similar Documents

Publication Publication Date Title
US20180075371A1 (en) Method and system for training a machine learning algorithm
JP5068383B1 (ja) 予測装置、予測方法及び予測プログラム
JP5977207B2 (ja) 状態推定装置、該方法及び該プログラム
JP2016164772A (ja) プロセス監視装置、プロセス監視方法及びプログラム
US11593697B2 (en) Method for amplitude estimation with noisy intermediate-scale quantum computers
JP6641849B2 (ja) 電力予測方法
Zheng et al. An approach to model building for accelerated cooling process using instance-based learning
JP2017120638A (ja) 結果予測装置及び結果予測方法
JP2017125754A (ja) 処理対象の熱伝達率算出方法、及びこれを用いた処理対象の熱処理方法
JP5682131B2 (ja) 鋼材の材質予測装置
JP2015066569A (ja) 圧延制御装置および圧延制御方法
Zhan et al. Big data benchmarks, performance optimization, and emerging hardware
WO2017145664A1 (ja) 最適化システム、最適化方法および最適化プログラム
JP2013226596A (ja) 圧延荷重の学習制御装置および学習制御方法、並びにこれを用いた金属板製造方法
EP3293683A1 (en) Method and system for training a machine learning algorithm for selecting process parameters for an industrial process
JP2015078834A (ja) プロセッシングマップ作成プログラム
JP2020071493A (ja) 結果予測装置、結果予測方法、及びプログラム
JP6665475B2 (ja) 炉温設定方法及び炉温設定装置
JP2019053589A (ja) 強化学習プログラム、強化学習方法、および強化学習装置
JP2019005874A (ja) 工作機械の熱変位の補正方法及び補正装置
JP2017121638A (ja) 圧延時間予測方法及び加熱炉の抽出時刻決定方法
CN115776936A (zh) 优化增材制造中的过程参数
JP2019206008A (ja) 状態推定装置、状態推定方法、及びプログラム
JP2019098380A (ja) Taf値推定方法及び圧下量配分設定方法
JP4850803B2 (ja) 材料内部の温度推定方法、熱流束の推定方法、装置、及びコンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150901

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160721

R150 Certificate of patent or registration of utility model

Ref document number: 5977207

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150